HanLP 学习
学习 HanLP 需要了解,
pip install hanlp[full] -i https://pypi.tuna.tsinghua.edu.cn/simple
HanLP词性标注集
| 标签 | 含义 |
|---|---|
| a | 形容词 |
| ad | 副形词 |
| ag | 形容词性语素 |
| al | 形容词性惯用语 |
| an | 名形词 |
| b | 区别词 |
| begin | 仅用于始##始 |
| bg | 区别语素 |
| bl | 区别词性惯用语 |
| c | 连词 |
| cc | 并列连词 |
| d | 副词 |
| dg | 辄,俱,复之类的副词 |
| dl | 连语 |
| e | 叹词 |
| end | 仅用于终##终 |
| f | 方位词 |
| g | 学术词汇 |
| gb | 生物相关词汇 |
| gbc | 生物类别 |
| gc | 化学相关词汇 |
| gg | 地理地质相关词汇 |
| gi | 计算机相关词汇 |
| gm | 数学相关词汇 |
| gp | 物理相关词汇 |
| h | 前缀 |
| i | 成语 |
| j | 简称略语 |
| k | 后缀 |
| l | 习用语 |
| m | 数词 |
| mg | 数语素 |
| Mg | 甲乙丙丁之类的数词 |
| mq | 数量词 |
| n | 名词 |
| nb | 生物名 |
| nba | 动物名 |
| nbc | 动物纲目 |
| nbp | 植物名 |
| nf | 食品,比如“薯片” |
| ng 名词性语素 | |
| nh | 医药疾病等健康相关名词 |
| nhd | 疾病 |
| nhm | 药品 |
| ni | 机构相关(不是独立机构名) |
| nic | 下属机构 |
| nis | 机构后缀 |
| nit | 教育相关机构 |
| nl | 名词性惯用语 |
| nm | 物品名 |
| nmc | 化学品名 |
| nn | 工作相关名词 |
| nnd | 职业 |
| nnt | 职务职称 |
| nr | 人名 |
| nr1 | 复姓 |
| nr2 | 蒙古姓名 |
| nrf | 音译人名 |
| nrj | 日语人名 |
| ns | 地名 |
| nsf | 音译地名 |
| nt | 机构团体名 |
| ntc | 公司名 |
| ntcb | 银行 |
| ntcf | 工厂 |
| ntch | 酒店宾馆 |
| nth | 医院 |
| nto | 政府机构 |
| nts 中小学 | |
| ntu | 大学 |
| nx | 字母专名 |
| nz | 其他专名 |
| o | 拟声词 |
| p | 介词 |
| pba | 介词“把” |
| pbei | 介词“被” |
| q | 量词 |
| qg | 量词语素 |
| qt | 时量词 |
| qv | 动量词 |
| r | 代词 |
| rg | 代词性语素 |
| Rg | 古汉语代词性语素 |
| rr | 人称代词 |
| ry | 疑问代词 |
| rys | 处所疑问代词 |
| ryt | 时间疑问代词 |
| ryv | 谓词性疑问代词 |
| rz | 指示代词 |
| rzs | 处所指示代词 |
| rzt | 时间指示代词 |
| rzv | 谓词性指示代词 |
| s | 处所词 |
| t | 时间词 |
| tg | 时间词性语素 |
| u | 助词 |
| ud | 助词 |
| ude1 | 的 底 |
| ude2 | 地 |
| ude3 | 得 |
| udeng | 等 等等 云云 |
| udh | 的话 |
| ug | 过 |
| uguo | 过 |
| uj | 助词 |
| ul | 连词 |
| ule | 了 喽 |
| ulian | 连 (“连小学生都会”) |
| uls | 来讲 来说 而言 说来 |
| usuo | 所 |
| uv | 连词 |
| uyy | 一样 一般 似的 般 |
| uz | 着 |
| uzhe | 着 |
| uzhi | 之 |
| v | 动词 |
| vd | 副动词 |
| vf | 趋向动词 |
| vg | 动词性语素 |
| vi | 不及物动词(内动词) |
| vl | 动词性惯用语 |
| vn | 名动词 |
| vshi | 动词“是” |
| vx | 形式动词 |
| vyou | 动词“有” |
| w | 标点符号 |
| wb | 百分号千分号,全角:% ‰ 半角:% |
| wd | 逗号,全角:, 半角:, |
| wf | 分号,全角:; 半角: ; |
| wh | 单位符号,全角:¥ $ £ ° ℃ 半角:$ |
| wj | 句号,全角:。 |
| wky | 右括号,全角:) 〕 ] } 》 】 〗 〉 半角: ) ] { > |
| wkz | 左括号,全角:( 〔 [ { 《 【 〖 〈 半角:( [ { < |
| wm | 冒号,全角:: 半角: : |
| wn | 顿号,全角:、 |
| wp | 破折号,全角:—— -- ——- 半角:— —- |
| ws | 省略号,全角:…… … |
| wt | 叹号,全角:! |
| ww | 问号,全角:? |
| wyy | 右引号,全角:” ’ 』 |
| wyz | 左引号,全角:“ ‘ 『 |
| x | 字符串 |
| xu | 网址URL |
| xx | 非语素字 |
| y | 语气词(delete yg) |
| yg | 语气语素 |
| z | 状态词 |
| zg | 状态词 |
HanLP 学习的更多相关文章
- Hanlp学习笔记
一.首先要引入mawen依赖包: <dependency> <groupId>com.hankcs</groupId> <artifactId>hanl ...
- 菜鸟如何使用hanlp做分词的过程记录
菜鸟如何使用hanlp做分词的过程记录 最近在学习hanlp的内容,准备在节后看看有没有时间整理一波hanlp分享下,应该还是会像之前分享DKHadoop一样的方式吧.把整个学习的过程中截图在配文字的 ...
- Elasticsearch集成HanLP分词器-个人学习
1.通过git下载分词器代码. 连接如下:https://gitee.com/hualongdata/hanlp-ext hanlp官网如下:http://hanlp.linrunsoft.com/ ...
- 13.深度学习(词嵌入)与自然语言处理--HanLP实现
笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP 13. 深度学习与自然语言处理 13.1 传统方法的局限 前面已经讲过了隐马尔可夫 ...
- NLP入门学习中关于分词库HanLP导入使用教程
大家好,时隔多年再次打开我的博客园写下自己的经验和学习总结,开园三年多,文章数少得可怜,一方面自己技术水平局限,另一方面是自己确实想放弃写博客.由于毕业工作的原因,经常性的加班以及仅剩下少的可怜的休息 ...
- 【HanLP】资料链接汇总
Java中调用HanLP配置 HanLP自然语言处理包开源官方文档 了解HanLP的全部 自然语言处理HanLP 开源自由的汉语言处理包主页 GitHub源码 基于hanLP的中文分词详解-MapRe ...
- 机器学习(Machine Learning)&深度学习(Deep Learning)资料【转】
转自:机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一 ...
- NLP+词法系列(二)︱中文分词技术简述、深度学习分词实践(CIPS2016、超多案例)
摘录自:CIPS2016 中文信息处理报告<第一章 词法和句法分析研究进展.现状及趋势>P4 CIPS2016 中文信息处理报告下载链接:http://cips-upload.bj.bce ...
- AI 学习路线
[导读] 本文由知名开源平台,AI技术平台以及领域专家:Datawhale,ApacheCN,AI有道和黄海广博士联合整理贡献,内容涵盖AI入门基础知识.数据分析挖掘.机器学习.深度学习.强化学习.前 ...
- Hanlp自然语言处理工具之词法分析器
本章是接前两篇<分词工具Hanlp基于感知机的中文分词框架>和<基于结构化感知机的词性标注与命名实体识别框架>的.本系统将同时进行中文分词.词性标注与命名实体识别3个任务的子系 ...
随机推荐
- DS必背合集
Data Structure必背合集 一.链表.栈和队列 1.简述说明数据的存储结构: 答: (1)顺序存储:逻辑上相邻的两个元素的物理位置也相邻. 优点:能够随机存取. 缺点:插入删除需要移动大量的 ...
- reverse_re3
main函数 点击重要函数 对if里面的数字按r键,使其从ASCII码转为字符 发现wasd四个关键的移动方向键,判断为迷宫问题 判断应该是要次数为2,即次数++3(从0开始计数)次才会有flag 点 ...
- AtCoder Beginner Contest 237 G - Range Sort Query
原题链接 G - Range Sort Query 思路: \(x\)是固定的,所以考虑将排序维护成0 1串,为\(p_i < x\)为\(0\),那么\(p_i \geq x\)为\(1\), ...
- 使用 sed 处理文本文件
前言 sed 是一款 GNU 流编辑器,可以按照指定的规则去处理文本文件或流,其强大的功能使用户在命令中快捷地修改文本文件成为可能. 它不会修改文件,除非使用shell重定向来保存结果.默认情况下,所 ...
- 2023-11-25:用go语言,给定一个数组arr,长度为n,表示n个格子的分数,并且这些格子首尾相连, 孩子不能选相邻的格子,不能回头选,不能选超过一圈, 但是孩子可以决定从任何位置开始选,也可以
2023-11-25:用go语言,给定一个数组arr,长度为n,表示n个格子的分数,并且这些格子首尾相连, 孩子不能选相邻的格子,不能回头选,不能选超过一圈, 但是孩子可以决定从任何位置开始选,也可以 ...
- C#中的类和继承
公众号「DotNet学习交流」,分享学习DotNet的点滴. 类继承 通过继承我们可以定义一个新类,新类纳入一个已经声明的类并进行扩展. 可以使用一个已经存在的类作为新类的基础.已存在的类称为基类(b ...
- AntDesignBlazor示例——列表查询条件
本示例是AntDesign Blazor的入门示例,在学习的同时分享出来,以供新手参考. 示例代码仓库:https://gitee.com/known/AntDesignDemo 1. 学习目标 重构 ...
- 数据仓库——Hive
数据仓库:是一个用于储存,分析,报告的数据系统 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持 数仓专注分析 数据仓库仓库为何而来,解决什么问题的? 为了分析数据而来,分析结 ...
- MybatisPlus实现高效的多对多查询
1.前置 事先声明一下代码中蕴含了大量的Stream和Lambda表达式操作,还不清楚的小伙伴可以去参考一下Java8新特性Stream流,而却我是用的是MybatisPlus这方面不清楚的也可以参考 ...
- MySQL运维6-Mycat垂直分库
一.垂直分库场景 场景:在业务系统中,涉及一下表结构,但是由于用户与订单每天都会产生大量的数据,单台服务器的数据存储以及处理能力是有限的,可以对数据库表进行拆分,原有数据库如下 说明1:整个业务系统中 ...