比较好的一套处理工具吧,感谢作者,原文地址:https://github.com/ownthink/Jiagu

练习一下使用

"""
Funciton: jiagu测试
Author: dyx
DateTime: 20191021
"""
import jiagu # 分词,词性标注,命名实体模块
def model_01():
text = '厦门市美亚柏科信息股份有限公司,邓叶勋任自然语言处理算法工程师一职'
jieba_words = jiagu.seg(text)
print(jieba_words)
words = jiagu.seg(text)
print(words)
pos = jiagu.pos(words)
print(pos)
ner = jiagu.ner(text)
print(ner) # 知识图谱关系抽取
def model_02():
# text = '吻别是由张学友演唱的一首歌曲'
text = '新疆大学(Xinjiang University),简称“新大”,位于新疆维吾尔自治区首府乌鲁木齐,是世界一流大学建设高校、全国重点大学'
knowledge = jiagu.knowledge(text)
print(knowledge) # 关键词抽取
def model_03():
text = '新疆大学(Xinjiang University),简称“新大”,位于新疆维吾尔自治区首府乌鲁木齐,是世界一流大学建设高校、全国重点大学、国家“211工程”重点建设高校、国家西部大开发重点建设高校、中西部高校基础能力建设工程高校、中国政府奖学金来华留学生接收院校、国家建设高水平大学公派研究生项目高校、”卓越工程师教育培养计划“高校、”卓越法律人才教育培养计划“高校、教育部与新疆维吾尔自治区人民政府合作共建高校、中西部“一省一校”国家重点建设大学(Z14)联盟成员、中国—中亚国家大学联盟发起高校、全国深化创新创业教育改革示范高校。'
keywords = jiagu.keywords(text)
print(keywords) # 文本摘要
def model_04():
text = '新疆大学(Xinjiang University),简称“新大”,位于新疆维吾尔自治区首府乌鲁木齐,是世界一流大学建设高校、全国重点大学、国家“211工程”重点建设高校、国家西部大开发重点建设高校、中西部高校基础能力建设工程高校、中国政府奖学金来华留学生接收院校、国家建设高水平大学公派研究生项目高校、”卓越工程师教育培养计划“高校、”卓越法律人才教育培养计划“高校、教育部与新疆维吾尔自治区人民政府合作共建高校、中西部“一省一校”国家重点建设大学(Z14)联盟成员、中国—中亚国家大学联盟发起高校、全国深化创新创业教育改革示范高校。 新疆大学前身是创办于1924年的新疆俄文法政专门学校。1935年1月改建为新疆学院,1960年10月1日,正式成立新疆大学,1978年被国务院确定为新疆唯一的全国重点大学,1997年被列入国家“211工程”,2000年被确定为国家西部大开发重点建设高校。2000年12月30日,新疆大学与原新疆工学院合并组建新的新疆大学。2004年,学校成为新疆维吾尔自治区人民政府、教育部“区部共建”高校。2017年6月,新疆大学被教育部列入国家“双一流”建设战略布局中42所“世界一流大学”建设之列。2018年,列入“部省合作共建高校”序列。 '
summarize = jiagu.summarize(text, 1)
print(summarize) # 情感分析
def model_05():
text = '艾略特波浪理论是我的最爱'
text = '很讨厌还是个懒鬼'
text = '我喜欢你'
sentiment = jiagu.sentiment(text)
print(sentiment) # 文本聚类
def model_06():
docs = ['百度深度学习中文情感分析工具Senta试用及在线测试',
'情感分析是自然语言处理里面一个热门话题',
'AI Challenger 2018 文本挖掘类竞赛相关解决方案及代码汇总',
'深度学习实践:从零开始做电影评论文本情感分析',
'BERT相关论文、文章和代码资源汇总',
'将不同长度的句子用BERT预训练模型编码,映射到一个固定长度的向量上',
'自然语言处理工具包spaCy介绍',
'现在可以快速测试一下spaCy的相关功能,我们以英文数据为例,spaCy目前主要支持英文和德文']
cluster = jiagu.text_cluster(docs)
print(cluster) if __name__ == '__main__': model_01()
model_02()
model_03()
model_04()
model_05()
model_06()

jiagu-工具使用的更多相关文章

  1. 自然语言处理NLP学习笔记二:NLP实战-开源工具tensorflow与jiagu使用

    前言: NLP工具有人推荐使用spacy,有人推荐使用tensorflow. tensorflow:中文译作:张量(超过3维的叫张量)详细资料参考:http://www.tensorfly.cn/ J ...

  2. Android代码安全工具集

    前言 原计划出一系列APP测试文章,从基础发,整个思路还在整理,秉着吹牛的态度,整理了一部分安卓代码安全的工具推荐给大家玩玩,提升一下逼格. 在这之前给大家讲讲阿旺对安全测试的理解,不管别人怎么扯,一 ...

  3. 基于Frida框架打造Art模式下的脱壳工具(OpenMemory)的原理分析

    本文博客地址:https://blog.csdn.net/QQ1084283172/article/details/80956614 作者dstmath在看雪论坛公布一个Android的art模式下基 ...

  4. Unity3d入门 - 关于unity工具的熟悉

    上周由于工作内容较多,花在unity上学习的时间不多,但总归还是学习了一些东西,内容如下: .1 根据相关的教程在mac上安装了unity. .2 学习了unity的主要的工具分布和对应工具的相关的功 ...

  5. 细说前端自动化打包工具--webpack

    背景 记得2004年的时候,互联网开发就是做网页,那时也没有前端和后端的区分,有时一个网站就是一些纯静态的html,通过链接组织在一起.用过Dreamweaver的都知道,做网页就像用word编辑文档 ...

  6. 应用工具 .NET Portability Analyzer 分析迁移dotnet core

    大多数开发人员更喜欢一次性编写好业务逻辑代码,以后再重用这些代码.与构建不同的应用以面向多个平台相比,这种方法更加容易.如果您创建与 .NET Core 兼容的.NET 标准库,那么现在比以往任何时候 ...

  7. .NetCore中的日志(2)集成第三方日志工具

    .NetCore中的日志(2)集成第三方日志工具 0x00 在.NetCore的Logging组件中集成NLog 上一篇讨论了.NetCore中日志框架的结构,这一篇讨论一下.NetCore的Logg ...

  8. dll文件32位64位检测工具以及Windows文件夹SysWow64的坑

    自从操作系统升级到64位以后,就要不断的需要面对32位.64位的问题.相信有很多人并不是很清楚32位程序与64位程序的区别,以及Program Files (x86),Program Files的区别 ...

  9. Java基础Map接口+Collections工具类

    1.Map中我们主要讲两个接口 HashMap  与   LinkedHashMap (1)其中LinkedHashMap是有序的  怎么存怎么取出来 我们讲一下Map的增删改查功能: /* * Ma ...

  10. 渗透测试工具BurpSuite做网站的安全测试(基础版)

    渗透测试工具BurpSuite做网站的安全测试(基础版) 版权声明:本文为博主原创文章,未经博主允许不得转载. 学习网址: https://t0data.gitbooks.io/burpsuite/c ...

随机推荐

  1. c#语法复习总结(2)-数据类型

    C#数据类型可以分值类型和引用类型.值类型,先说说一个概念 c#栈和堆. 一,栈和堆. 堆:在c里面叫堆,在c#里面其实叫托管堆.为什么叫托管堆,我们往下看. 栈:就是堆栈,因为和堆一起叫着别扭,就简 ...

  2. H5 选择图片上传及预览

    <div class="sctp"> <img src="img/sczp.png" id="photo" alt=&qu ...

  3. AspNetCore.Identity详解2——注册用户

    上一篇:AspNetCore.Identity详解1——入门使用 打开数据库,可以看到使用EF自动生成的表结构如下: 重点关注AspNetUsers表,打开数据库里的表可以知道目前也只用到了这张表.然 ...

  4. [Silverlight 4] 參數的傳遞方法

    Silverlight都會有一個專案叫 *.Web,有個ManagePage.aspx裝戴Silverlight元件,也是應用程式的入口 然後還會有一個專案(此處叫ManageBack),會編譯成Si ...

  5. Asp.net MVC企业级开发(02)---Log4net

    Log4Net 是用来记录日志的,可以将程序运行过程中的信息输出到一些地方(文件.数据库.EventLog等).日志就是程序的“黑匣子”,可以通过日志查看系统的运行过程,从而发现系统的问题. 日志的作 ...

  6. English--元音

    English|元音 在一开始学习英语的时候,最需要掌握的就是音标.所以需要从音标的元音开始,并且不局限于掌握音标的元音与辅音,大家可以参考下英文版发音课,并不知道只学习元音与辅音,还有各种弱读连读等 ...

  7. #pragma once和#ifndef

    C语言中的头文件只是简单的复制粘贴. C语言中变量.函数.结构体的定义和声明两个过程是分离的.声明通常放在头文件中,为了防止重复声明,需要保证头文件中的内容在构建obj文件时只被包含一次.这可以通过# ...

  8. String类常用功能

    String类常用功能 判断: boolean equals(Object obj) boolean equalsIgnoreCase(String str) //忽略大小写 boolean star ...

  9. 实验吧——让我进去(hash长度扩展攻击)

    题目地址:http://ctf5.shiyanbar.com/web/kzhan.php 在页面源码没发现什么,于是用burp进行抓包重放 看到有setcookie,于是重新刷新页面拦截数据包(这次才 ...

  10. 恭喜你!看到这6个MES系统选型的大坑,千万要避免!

    随着工业4.0概念的出现,智能化生产成为了各大制造业的发展趋势! MES系统可以为企业提供包括制造数据管理.计划排程管理.生产调度管理.库存管理.质量管理.人力资源管理.工作中心/设备管理.工具工装管 ...