1、hanlp简介

HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

Hanlp具有以下功能:

  • 中文分词
  • 词性标注
  • 命名实体识别
  • 依存句法分析
  • 关键词提取新词发现
  • 短语提取
  • 自动摘要
  • 文本分类
  • 拼音简繁

2、hanlp安装

第一步:hanlp提供了python库模块,需要在系统命令框(ctrl+r,enter :cmd)中输入如下代码,即可安装pyhanlp库

pip install pyhanlp

第二步:hanlp库依赖数据包,因此要成功使用还需要下载特定的数据包,需要的数据包有:data-for-1.7.7.zip(最新版),

data下载地址:https://github.com/hankcs/HanLP/releases

下载后,放入文件目录,目录根据你安装python编译器的位置而定,如我的目录是:E:\tool\python\Lib\site-packages\pyhanlp\static,找不到你的路径可以在命令框中重新输入一遍安装命令,即可。注意,下载好数据包后,不用解压,直接放到你的目录下。然后输入以下代码:

from python import*

运行,即可自动解压,成功后,开始测试。

3、hanlp功能测试

输入简单的测试代码,测试hanlp的功能:

from pyhanlp import*

sentence = "我喜欢当个作家,那种写自己爱看的书的作家,写能让很多读者看来欲罢不能的书的作家,写那种酣畅淋漓的书的作家"

terms = HanLP.segment(sentence )
print(terms)

结果展示:

输出:[我/rr, 喜欢/vi, 当/p, 个/q, 作家/nnt, ,/w, 那种/r, 写/v, 自己/rr, 爱看/v, 的/ude1, 书/n, 的/ude1, 作家/nnt, ,/w, 写/v, 能/v, 让/v, 很多/m, 读者/n, 看来/v, 欲罢不能/vl, 的/ude1, 书/n, 的/ude1, 作家/nnt, ,/w, 写/v, 那种/r, 酣畅淋漓/al, 的/ude1, 书/n, 的/ude1, 作家/nnt]

4、hanlp参考文档

pyhanlp的参考文档:https://github.com/hankcs/pyhanlp

hanlp的参考文档:https://github.com/hankcs/HanLP/blob/master/README.md

5、注意事项

pynlp和hanlp都是hanlp旗下的分词、词性标注工具,HanLP是一个Java工具包,python是基于python的工具包,如果是用pycharm编译python程序,安装pyhanlp足以。

pyhanlp安装教程的更多相关文章

  1. Linux+apache+mono+asp.net安装教程

    Linux+apache+mono+asp.net安装教程(CentOS上测试的) 一.准备工作: 1.安装linux系统(CentOS,这个就不多讲了) 2.下载所需软件 http-2.4.4.ta ...

  2. Greenplum 源码安装教程 —— 以 CentOS 平台为例

    Greenplum 源码安装教程 作者:Arthur_Qin 禾众 Greenplum 主体以及orca ( 新一代优化器 ) 的代码以可以从 Github 上下载.如果不打算查看代码,想下载编译好的 ...

  3. git 安装教程

    昆,简单说下安装教程1,安装Git2,安装TortoiseGit3,打开第一步安装的git工具GIT BASH

  4. Docker和Docker-compose安装教程以及docker-elk,docker-storm安装教程

    此安装教程仅供我自己安装配置时查看,其他的人不可以偷看!!! 安装Docker 1. Update package information, ensure that APT works with th ...

  5. RHEL 6.3 详细安装教程

    以前刚接触linux时,什么都不懂,为了学习,在电脑上安装双系统(原系统为Win7),吃过不少苦头,在网上搜教程,很多都是语焉不详,导致安装过程中战战兢兢.最近朋友面试运维,面试官有考他对linux安 ...

  6. Android Studio的下载和安装教程(从ADT到AS)

    之前一直使用的是Android development tools(简称ADT),后来说是google对ADT不再提供支持,然后一直在考虑是否把自己电脑换成Android Studio(简称AS),从 ...

  7. mysql快速导出数据库ER图和数据字典(附navicat11安装教程及资源)

    ♣ mysql使用navicat11快速导出数据库ER图 ♣ mysql使用navicat11快速导出数据库数据字典 ♣ navicat11 for mysql (这里是mysql5.7.12)专业版 ...

  8. Smokeping安装教程

    Smokeping安装教程 #Smokeping2.6.8安装教程 #2016.3.6 改编v1.0 #Linux运维技术交流 347163978   环境 CentOS release 6.4 (F ...

  9. (二)ADS1.2的安装教程以及使用 调试 (不会 AXD 调试工具)

    安装教程: 参考百度 http://jingyan.baidu.com/article/cdddd41c7db85253cb00e1ae.html 具体使用看: 杨铸的那本书(嵌入式底层软件驱动开发) ...

随机推荐

  1. Julia基础语法复数和分数

     1.复数   2.分数

  2. 在pytorch下使用tensorboardX(win10;谷歌浏览器;jupyter notebook)

    使用环境:win10 ,在jupyter notebook下运行 谷歌浏览器 1.环境安装 使用conda 安装,打开anacond powershell,输入pip install tensorbo ...

  3. 解析网站爬取腾讯vip视频

    今天用油猴脚本vip一件解析看神奇队长.想到了问题,这个页面应该是找到了视频的api的接口,通过接口调用获取到了视频的地址. 那自己找腾讯视频地址多费劲啊,现在越来越多的参数,眼花缭乱的. 那我就找到 ...

  4. (转载)基于BIGINT溢出错误的SQL注入

    我对于通过MySQL错误提取数据的新技术非常感兴趣,而本文中要介绍的就是这样一种技术.当我考察MySQL的整数处理方式的时候,突然对如何使其发生溢出产生了浓厚的兴趣.下面,我们来看看MySQL是如何存 ...

  5. pytorch torchversion自带的数据集

    from torchvision.datasets import MNIST # import torchvision # torchvision.datasets. #准备数据集 mnist = M ...

  6. CSS躬行记(7)——合成

    在图形编辑软件中,可以按特定地方式处理不同图层的合成,最新的CSS规范也引入了该功能,并提供了mix-blend-mode和background-blend-mode两个属性.混合模式(blendin ...

  7. Python数据分析入门与实践 学习

    pandas是一个Python语言的软件包,在我们使用Python语言进行机器学习编程的时候,这是一个非常常用的基础编程库.本文是对它的一个入门教程.pandas提供了快速,灵活和富有表现力的数据结构 ...

  8. thinkphp--多个id查询

    $feedback_list = $feedback -> where( array("member_id"=>array("in", " ...

  9. 20199308《Linux内核原理与分析》第十一周作业

    缓冲区溢出漏洞实验 实验步骤 一.初始设置 1.Ubuntu 和其他一些 Linux 系统中,使用地址空间随机化来随机堆(heap)和栈(stack)的初始地址,这使得猜测准确的内存地址变得十分困难, ...

  10. JDK 15 JAVA 15的新特性展望

    目录 JEP 371: Hidden Classes JEP 372: 删除 Nashorn JavaScript Engine JEP 377: 新的垃圾回收器ZGC正式上线了 JEP 378: T ...