【3-1】实验——hanlp和jieba常用方法

2024-01-30 17:30:03
开发
38

一.下载pyhanlp

1.打开conda使用如下语句

conda install -c conda-forge openjdk python=3.8 jpype1=0.7.0 -y
pip install pyhanlp

附：提供了一个安装教程

index of /book/intro_nlp/安装包/ - 蝴蝶效应网盘 (hankcs.com)

二.安装中的特殊情况

2.(特殊情况）下载完成后打开jupyter notebook后，使用pyhanlp，产生了自动更新

三、实验

代码

from pyhanlp import *

print(HanLP.segment('你好，欢迎在Python中调用HanLP的API'))  
for term in HanLP.segment('下雨天地面积水'):  
    print('{}\t{}'.format(term.word, term.nature)) # 获取单词与词性  
testCases = [  
    "商品和服务",  
    "结婚的和尚未结婚的确实在干扰分词啊",  
    "买水果然后来世博园最后去世博会",  
    "中国的首都是北京",  
    "欢迎新老师生前来就餐",  
    "工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作",  
    "随着页游兴起到现在的页游繁盛，依赖于存档进行逻辑判断的设计减少了，但这块也不能完全忽略掉。"]  
for sentence in testCases: print(HanLP.segment(sentence))

结果展示

四、jieba使用方法实验

1.下载jieba

pip install jieba

2.实验代码

# encoding=utf-8  
import jieba  
  
seg_list = jieba.cut("我来到北京清华大学", cut_all=True)  
print("Full Mode: " + "/ ".join(seg_list))  # 全模式  
print(seg_list)  

text1 = '李小福是创新办主任也是云计算方面的专家'  
jieba.load_userdict('userdict.txt') # file_name为自定义词典的路径  
seg_list1 = jieba.cut(text1, cut_all=False)  
print("/ ".join(seg_list1))

3.结果

原文地址:https://blog.csdn.net/m0_37932764/article/details/135871191 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1752262890221604864.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

【3-1】实验——hanlp和jieba常用方法

2024-01-30 17:30:03 39 阅读
hanlp,pkuseg,jieba,cutword分词实践

2024-01-30 17:30:03 41 阅读
git 常用命令和使用方法

2024-01-30 17:30:03 14 阅读
【Python 常用脚本及命令系列 1.3 -- 使用Python实现串口读写】

2024-01-30 17:30:03 9 阅读
【小程序】常用方法、知识点汇总1

2024-01-30 17:30:03 14 阅读
Arcgis pro 字段计算器 python3常用方法二

2024-01-30 17:30:03 37 阅读
华为端口安全常用3种方法配置案例

2024-01-30 17:30:03 29 阅读
lodash常用方法

2024-01-30 17:30:03 32 阅读
android常用方法

2024-01-30 17:30:03 43 阅读
【笔记】常用方法

2024-01-30 17:30:03 30 阅读

热门阅读

数字媒体技术基础之：声音（国外视频笔记版）

2024-01-30 17:30:03 34 阅读
掌握这9个技巧，让Python代码快如闪电（下）

2024-01-30 17:30:03 36 阅读
【力扣经典面试题】27. 移除元素

2024-01-30 17:30:03 40 阅读
vue3之echarts3D环柱图-间隔版

2024-01-30 17:30:03 33 阅读
JVM篇：垃圾回收器

2024-01-30 17:30:03 31 阅读
oracle等保测评

2024-01-30 17:30:03 31 阅读
【vue】defineModel在vue3.4中的最新用法和详解

2024-01-30 17:30:03 39 阅读
Spring JPA与Hibernate学习使用

2024-01-30 17:30:03 38 阅读
Oracle Extractor 软件下载

2024-01-30 17:30:03 42 阅读
ROS学习笔记11——ROS中的重名问题

2024-01-30 17:30:03 39 阅读
[玄机]流量特征分析-蚁剑流量分析

2024-01-30 17:30:03 37 阅读
git由SSH更改为HTTPS

2024-01-30 17:30:03 32 阅读
【算法专题】贪心算法

2024-01-30 17:30:03 34 阅读
【Linux】权限

2024-01-30 17:30:03 27 阅读
OpenGL ES 渲染 NV21、NV12 格式图像有哪些“姿势”？

2024-01-30 17:30:03 42 阅读
【web安全】文件上传漏洞

2024-01-30 17:30:03 34 阅读
14个国产AI大模型备案获批，众多科技巨头进入AIGC赛道

2024-01-30 17:30:03 34 阅读
idea 创建 spring boot

2024-01-30 17:30:03 35 阅读
uniapp-v3组合式语法-data实现

2024-01-30 17:30:03 34 阅读
Blender教程（基础）-面的细分与删除、挤出选区-07

2024-01-30 17:30:03 30 阅读
CSS transition（过渡效果）详解

2024-01-30 17:30:03 35 阅读
【Rust】第七节：枚举与模式匹配

2024-01-30 17:30:03 41 阅读
虹科方案|释放总线潜力：汽车总线离线模拟解决方案

2024-01-30 17:30:03 36 阅读
谈谈此前参加数学建模的感受

2024-01-30 17:30:03 34 阅读
Tensorflow2.x实现用于model.fit()中的医学图像dataset

2024-01-30 17:30:03 26 阅读
TensorFlow2实战-系列教程7：TFRecords数据源制作1

2024-01-30 17:30:03 39 阅读
时序数据库 Tdengine 执行命令能够查看执行的sql语句

2024-01-30 17:30:03 37 阅读
RAG应用-七个最常见的故障点

2024-01-30 17:30:03 36 阅读
day08-搜附近以及探花功能实现

2024-01-30 17:30:03 24 阅读
js读取json的固定数据的一种方法

2024-01-30 17:30:03 36 阅读