HanLP 学习
学习 HanLP 需要了解,
pip install hanlp[full] -i https://pypi.tuna.tsinghua.edu.cn/simple
HanLP词性标注集
标签 | 含义 |
---|---|
a | 形容词 |
ad | 副形词 |
ag | 形容词性语素 |
al | 形容词性惯用语 |
an | 名形词 |
b | 区别词 |
begin | 仅用于始##始 |
bg | 区别语素 |
bl | 区别词性惯用语 |
c | 连词 |
cc | 并列连词 |
d | 副词 |
dg | 辄,俱,复之类的副词 |
dl | 连语 |
e | 叹词 |
end | 仅用于终##终 |
f | 方位词 |
g | 学术词汇 |
gb | 生物相关词汇 |
gbc | 生物类别 |
gc | 化学相关词汇 |
gg | 地理地质相关词汇 |
gi | 计算机相关词汇 |
gm | 数学相关词汇 |
gp | 物理相关词汇 |
h | 前缀 |
i | 成语 |
j | 简称略语 |
k | 后缀 |
l | 习用语 |
m | 数词 |
mg | 数语素 |
Mg | 甲乙丙丁之类的数词 |
mq | 数量词 |
n | 名词 |
nb | 生物名 |
nba | 动物名 |
nbc | 动物纲目 |
nbp | 植物名 |
nf | 食品,比如“薯片” |
ng 名词性语素 | |
nh | 医药疾病等健康相关名词 |
nhd | 疾病 |
nhm | 药品 |
ni | 机构相关(不是独立机构名) |
nic | 下属机构 |
nis | 机构后缀 |
nit | 教育相关机构 |
nl | 名词性惯用语 |
nm | 物品名 |
nmc | 化学品名 |
nn | 工作相关名词 |
nnd | 职业 |
nnt | 职务职称 |
nr | 人名 |
nr1 | 复姓 |
nr2 | 蒙古姓名 |
nrf | 音译人名 |
nrj | 日语人名 |
ns | 地名 |
nsf | 音译地名 |
nt | 机构团体名 |
ntc | 公司名 |
ntcb | 银行 |
ntcf | 工厂 |
ntch | 酒店宾馆 |
nth | 医院 |
nto | 政府机构 |
nts 中小学 | |
ntu | 大学 |
nx | 字母专名 |
nz | 其他专名 |
o | 拟声词 |
p | 介词 |
pba | 介词“把” |
pbei | 介词“被” |
q | 量词 |
qg | 量词语素 |
qt | 时量词 |
qv | 动量词 |
r | 代词 |
rg | 代词性语素 |
Rg | 古汉语代词性语素 |
rr | 人称代词 |
ry | 疑问代词 |
rys | 处所疑问代词 |
ryt | 时间疑问代词 |
ryv | 谓词性疑问代词 |
rz | 指示代词 |
rzs | 处所指示代词 |
rzt | 时间指示代词 |
rzv | 谓词性指示代词 |
s | 处所词 |
t | 时间词 |
tg | 时间词性语素 |
u | 助词 |
ud | 助词 |
ude1 | 的 底 |
ude2 | 地 |
ude3 | 得 |
udeng | 等 等等 云云 |
udh | 的话 |
ug | 过 |
uguo | 过 |
uj | 助词 |
ul | 连词 |
ule | 了 喽 |
ulian | 连 (“连小学生都会”) |
uls | 来讲 来说 而言 说来 |
usuo | 所 |
uv | 连词 |
uyy | 一样 一般 似的 般 |
uz | 着 |
uzhe | 着 |
uzhi | 之 |
v | 动词 |
vd | 副动词 |
vf | 趋向动词 |
vg | 动词性语素 |
vi | 不及物动词(内动词) |
vl | 动词性惯用语 |
vn | 名动词 |
vshi | 动词“是” |
vx | 形式动词 |
vyou | 动词“有” |
w | 标点符号 |
wb | 百分号千分号,全角:% ‰ 半角:% |
wd | 逗号,全角:, 半角:, |
wf | 分号,全角:; 半角: ; |
wh | 单位符号,全角:¥ $ £ ° ℃ 半角:$ |
wj | 句号,全角:。 |
wky | 右括号,全角:) 〕 ] } 》 】 〗 〉 半角: ) ] { > |
wkz | 左括号,全角:( 〔 [ { 《 【 〖 〈 半角:( [ { < |
wm | 冒号,全角:: 半角: : |
wn | 顿号,全角:、 |
wp | 破折号,全角:—— -- ——- 半角:— —- |
ws | 省略号,全角:…… … |
wt | 叹号,全角:! |
ww | 问号,全角:? |
wyy | 右引号,全角:” ’ 』 |
wyz | 左引号,全角:“ ‘ 『 |
x | 字符串 |
xu | 网址URL |
xx | 非语素字 |
y | 语气词(delete yg) |
yg | 语气语素 |
z | 状态词 |
zg | 状态词 |
HanLP 学习的更多相关文章
- Hanlp学习笔记
一.首先要引入mawen依赖包: <dependency> <groupId>com.hankcs</groupId> <artifactId>hanl ...
- 菜鸟如何使用hanlp做分词的过程记录
菜鸟如何使用hanlp做分词的过程记录 最近在学习hanlp的内容,准备在节后看看有没有时间整理一波hanlp分享下,应该还是会像之前分享DKHadoop一样的方式吧.把整个学习的过程中截图在配文字的 ...
- Elasticsearch集成HanLP分词器-个人学习
1.通过git下载分词器代码. 连接如下:https://gitee.com/hualongdata/hanlp-ext hanlp官网如下:http://hanlp.linrunsoft.com/ ...
- 13.深度学习(词嵌入)与自然语言处理--HanLP实现
笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP 13. 深度学习与自然语言处理 13.1 传统方法的局限 前面已经讲过了隐马尔可夫 ...
- NLP入门学习中关于分词库HanLP导入使用教程
大家好,时隔多年再次打开我的博客园写下自己的经验和学习总结,开园三年多,文章数少得可怜,一方面自己技术水平局限,另一方面是自己确实想放弃写博客.由于毕业工作的原因,经常性的加班以及仅剩下少的可怜的休息 ...
- 【HanLP】资料链接汇总
Java中调用HanLP配置 HanLP自然语言处理包开源官方文档 了解HanLP的全部 自然语言处理HanLP 开源自由的汉语言处理包主页 GitHub源码 基于hanLP的中文分词详解-MapRe ...
- 机器学习(Machine Learning)&深度学习(Deep Learning)资料【转】
转自:机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一 ...
- NLP+词法系列(二)︱中文分词技术简述、深度学习分词实践(CIPS2016、超多案例)
摘录自:CIPS2016 中文信息处理报告<第一章 词法和句法分析研究进展.现状及趋势>P4 CIPS2016 中文信息处理报告下载链接:http://cips-upload.bj.bce ...
- AI 学习路线
[导读] 本文由知名开源平台,AI技术平台以及领域专家:Datawhale,ApacheCN,AI有道和黄海广博士联合整理贡献,内容涵盖AI入门基础知识.数据分析挖掘.机器学习.深度学习.强化学习.前 ...
- Hanlp自然语言处理工具之词法分析器
本章是接前两篇<分词工具Hanlp基于感知机的中文分词框架>和<基于结构化感知机的词性标注与命名实体识别框架>的.本系统将同时进行中文分词.词性标注与命名实体识别3个任务的子系 ...
随机推荐
- MATLAB(Octave)命令记录
1. struct:结构体数组 aaaa_s.a = 1; aaaa_s.b = {'A','B','C'} aaaa_s.c = [1 2 3 4; 5 6 7 8]; save aaaa_s.tx ...
- [Python急救站课程]叠加等边三角形的绘制
叠加等边三角形的绘制 from turtle import * penup() fd(-100) pendown() pensize(10) seth(60) fd(200) seth(-60) fd ...
- [Python] Turtle库的运用, 创作精美绘画
更多示例代码下载地址 : https://github.com/Amd794/Python123 前言 最初来自于 Wally Feurzig 和 Seymour Papert 于 1966 年所创造 ...
- RT-Thread 中 minIni 组件包无法添加的解决方法
事件 今天在 Env 下添加 minIni 包的时候出现了无法将其添加到工程的情况.借此机会来记录一下如何解决该类问题. 如果你想快速排错可以直接到 [2.minIni 组件出现的问题]查看. 一.准 ...
- 暴力+DP:买卖股票的最佳时机
给定一个数组,它的第 i 个元素是一支给定股票第 i 天的价格. 如果你最多只允许完成一笔交易(即买入和卖出一支股票一次),设计一个算法来计算你所能获取的最大利润. 注意:你不能在买入股票前卖出股票. ...
- 你真的了解HashSet 和HashMap的区别、优缺点、使用场景吗?
HashSet 和 HashMap 是 Java 集合框架中的两个常用类,它们都用于存储和管理数据,但在使用方式.功能和性能上有很大的区别. HashSet 和 HashMap 的区别 区别一:用途不 ...
- 通过 VS Code 优雅地编辑 Pod 内的代码(非 NodePort)
目录 1. 概述 2. NodePort 方式 3. Ingress 方式 4. 救命稻草 5. 其他 1. 概述 今天聊点啥呢,话说,你有没有想过怎样用 VS Code 连上 K8s 集群内的某个 ...
- SpringCloudAlibaba-OSS文件上传
一.引入相关依赖 <dependencyManagement> <dependencies> <dependency> <groupId>com.ali ...
- 算法那么多,AI量化交易策略如何选择最佳算法?
常见算法优劣比较 算法没有最好,只有更好. 这个问题的答案取决于许多因素,例如股票市场的条件,数据集的质量和特征工程的有效等.接下来,我们来看看这些算法的优势和劣势: 神经网络:适用于复杂的非线性问题 ...
- bash shell笔记整理——tail命令
作用 Print the last 10 lines of each FILE to standard output. With more than one FILE, precede each wi ...