ZH奶酪：自然语言处理工具LTP语言云调用方法

前言

LTP语言云平台

不支持离线调用；

　　支持分词、词性标注、命名实体识别、依存句法分析、语义角色标注；

　　不支持自定义词表，但是你可以先用其他支持自定义分词的工具（例如中科院的NLPIR）把文本进行分词，再让ltp帮你标注

支持C#、Go、Java、JavaScript、Nodejs、PHP、Python、R、Ruby等语言调用；　　

还有一些错误响应、频率限制、重要说明（这几个我至今也没用到）；

正文

官方网址：http://www.ltp-cloud.com/

使用文档：http://www.ltp-cloud.com/document/

在线演示：http://www.ltp-cloud.com/demo/

各种语言调用实例可以到Github上下载：https://github.com/HIT-SCIR/ltp-cloud-api-tutorial

例如Python版本的：https://github.com/HIT-SCIR/ltp-cloud-api-tutorial/tree/master/Python

Step1：注册

在这个网址申请一个API key，稍后会用到；

Step2：一个简单的例子（Python版）

（1）复制代码：从Github上复制一段代码（取决于你使用的语言和所需的功能）

（2）修改代码：

　　<1>把 api_key = "YourApiKey" 中的 "YourApiKey" 修改成你Step1申请的API Key；

　　<2>把 text = "我爱北京天安门" 修改成你要处理的文本；

　　<3>根据需求设置不同的参数（其实只需要api_key，text，pattern，format四个参数就够了，仔细看下pattern）：

# -*- coding: utf-8 -*-

#!/usr/bin/env python

# This example shows how to use Python to access the LTP API to perform full

# stack Chinese text analysis including word segmentation, POS tagging, dep-

# endency parsing, name entity recognization and semantic role labeling and

# get the result in specified format.

import urllib2, urllib

import sys

if __name__ == '__main__':

    if len(sys.argv) < 2 or sys.argv[1] not in ["xml", "json", "conll"]:

        print >> sys.stderr, "usage: %s [xml/json/conll]" % sys.argv[0]

        sys.exit(1)

    uri_base = "http://ltpapi.voicecloud.cn/analysis/?"

    api_key  = "YourApiKey"

    text     = "我爱北京天安门"

    # Note that if your text contain special characters such as linefeed or '&',

    # you need to use urlencode to encode your data

    text     = urllib.quote(text)

    format   = sys.argv[1]

    pattern  = "all"

    url      = (uri_base

               + "api_key=" + api_key + "&"

               + "text="    + text    + "&"

               + "format="  + format  + "&"

               + "pattern=" + "all")

    try:

        response = urllib2.urlopen(url)

        content  = response.read().strip()

        print content

    except urllib2.HTTPError, e:

        print >> sys.stderr, e.reason

Step3：运行

如果要批量处理txt或者xml文件，需要自己写一段批量处理的代码，下边是我之前项目中用到的一段批量处理某一目录下txt文件代码（就是加了一层循环和设置了一个输出）：

 # -*- coding: utf-8 -*-

 #!/usr/bin/env python

 # This example shows how to use Python to access the LTP API to perform full

 # stack Chinese text analysis including word segmentation, POS tagging, dep-

 # endency parsing, name entity recognization and semantic role labeling and

 # get the result in specified format.

 import urllib2, urllib

 import sys

 if __name__ == '__main__':

     uri_base = "http://ltpapi.voicecloud.cn/analysis/?"

     api_key  = "7132G4z1HE3S********DSxtNcmA1jScSE5XumAI"

     f = open("E:\\PyProj\\Others\\rite_sentence.txt")

     fw = open("E:\\PyProj\\Others\\rite_pos.txt",'w')

     line = f.readline()

     while(line):

         text     = line

         # Note that if your text contain special characters such as linefeed or '&',

         # you need to use urlencode to encode your data

         text     = urllib.quote(text)

         format   = "plain"

         pattern  = "pos"

         url      = (uri_base

                    + "api_key=" + api_key + "&"

                    + "text="    + text    + "&"

                    + "format="  + format  + "&"

                    + "pattern=" + pattern)

         try:

             response = urllib2.urlopen(url)

             content  = response.read().strip()

             print content

             fw.write(line+content+'\n')

         except urllib2.HTTPError, e:

             print >> sys.stderr, e.reason

         line = f.readline()

     fw.close()

     f.close()

ZH奶酪：自然语言处理工具LTP语言云调用方法的更多相关文章

python3使用ltp语言云
text="我爱自然语言处理." text=str(text) #text=urllib.quote(text) text=urllib.parse.quote(text) def ...
ZH奶酪：Python中zip函数的使用方法
定义:zip([iterable, …]) zip()是Python的一个内建函数,它接受一系列可迭代的对象作为参数,将对象中对应的元素打包成一个个tuple(元组),然后返回由这些 tuples组成 ...
ZH奶酪：JavaScript清空数组的三种方法
参考链接:http://snandy.iteye.com/blog/893955 方式1,length赋值为0 目前 Prototype中数组的 clear 方法和mootools库中数组的 empt ...
哈工大LTP语言分析：分词、词性标注、句法分析等
1. LTP介绍和安装 LTP语言云官网在线演示 | 语言云(语言技术平台云 LTP-Cloud) 安装LTP的python接口包 $ sudo pip install pyltp 模型文件下载 ...
ZH奶酪：哈工大LTP云平台标记含义及性能
从官网搬过来的囧rz 哈工大讯飞语言云由哈工大和科大讯飞联合研发的中文自然语言处理云服务平台.结合了哈工大“语言技术平台——LTP” 高效.精准的自然语言处理核心技术和讯飞公司在全国性大规模云 ...
Python自然语言处理工具小结
Python自然语言处理工具小结作者:白宁超 2016年11月21日21:45:26 目录 [Python NLP]干货!详述Python NLTK下如何使用stanford NLP工具包(1) [ ...
Python中调用自然语言处理工具HanLP手记
手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中 ...
Python 的十个自然语言处理工具
原文先mark,后续尝试. 1.NLTK NLTK 在用 Python 处理自然语言的工具中处于领先的地位.它提供了 WordNet 这种方便处理词汇资源的借口,还有分类.分词.除茎.标注.语法分析 ...
【HanLP】HanLP中文自然语言处理工具实例演练
HanLP中文自然语言处理工具实例演练作者:白宁超 2016年11月25日13:45:13 摘要:HanLP是hankcs个人完成一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环 ...

随机推荐

iOS 修改状态栏字体的颜色
在实际开发中,状态栏有时,需要我们自己设置: 比如: 默认状态栏假如我们开发的view是黑色的,那么效果如图: 状态栏是白底黑字,下面的view是黑底? 这样子真的好吗?说好的和谐社会呢?说好的开发 ...
ERP入门
为什么想起写这个题目哪?其实这个问题很久就想写了,记得2005年时候,公司新招的二位刚毕业的大学生,一个专业是经济管理,一个是会计,东北大区培训后公司让我选择了一位带一带,我选择了一个会计专业的(因为 ...
IIS 7.5 Application Warm-Up Module
http://www.cnblogs.com/shanyou/archive/2010/12/21/1913199.html 有些web应用在可以处理用户访问之前,需要装载很多的数据,或做一些花费很大 ...
FindBugs 入门——帮你减少代码中的bug数
FindBugs 入门 FindBugs 作用开发人员在开发了一部分代码后,可以使用FindBugs进行代码缺陷的检查.提高代码的质量,同时也可以减少测试人员给你报的bug数. 代码缺陷分类根据缺 ...
PHP 源码学习之线程安全
从作用域上来说,C语言可以定义4种不同的变量:全局变量,静态全局变量,局部变量,静态局部变量. 下面仅从函数作用域的角度分析一下不同的变量,假设所有变量声明不重名. 全局变量,在函数外声明,例如,in ...
Oracle数据库穿越防火墙访问
原因 Oracle listener 只起一个中介作用,当客户连接它时,它根据配置寻找到相应的数据库实例进程,然后spawned一个新的数据库连接,这个连接端口由listener传递给客户机,此后客户 ...
amCharts图表中的JavaScript中文注释引起的浏览器兼容性问题
近期用amCharts做图表.一切都很顺利,然后演示的时候掉链子了,平时开发的时候都是用的火狐和谷歌,加上这种图表框架本来就号称兼容性极好,也没有在ie上测试,演示的机器上恰巧用的是ie11,发现一个 ...
使用Struts框架，实现用户登陆功能
前言:本篇文章是本人这周学习的一个小结,在自我总结的同时,希望也能够给其他同学带来一点帮助.本文主要知识是参照书本上的知识点以及网上其他博客文章,在上机操练后的所得,具体源码主要来自http://bl ...
jstl中的sql:query标签获取的结果如何格式化输出
<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding= ...
浅谈Java中的对象和引用
浅谈Java中的对象和对象引用在Java中,有一组名词经常一起出现,它们就是“对象和对象引用”,很多朋友在初学Java的时候可能经常会混淆这2个概念,觉得它们是一回事,事实上则不然.今天我们就来一起 ...

ZH奶酪：自然语言处理工具LTP语言云调用方法

ZH奶酪：自然语言处理工具LTP语言云调用方法的更多相关文章

随机推荐

热门专题