Discuz!在线中文分词服务

Discuz!在线中文分词服务是基于API返回分词结果的。在项目中，我们只需要一个函数即可方便地进行分词、关键词提取。
以下是根据Discuz!在线分词服务API写的函数，测试可正常运行：

代码代码如下:

/**

 * DZ在线中文分词

 * @param $title string 进行分词的标题

 * @param $content string 进行分词的内容

 * @param $encode string API返回的数据编码

 * @return  array 得到的关键词数组

 */

 function dz_segment($title = '', $content = '', $encode = 'utf-8'){

    if($title == ''){

        return false;

    }

    $title = rawurlencode(strip_tags($title));

    $content = strip_tags($content);

    if(strlen($content)>2400){ //在线分词服务有长度限制

        $content =  mb_substr($content, 0, 800, $encode);

    }

    $content = rawurlencode($content);

    $url = 'http://keyword.discuz.com/related_kw.html?title='.$title.'&content='.$content.'&ics='.$encode.'&ocs='.$encode;

    $xml_array=simplexml_load_file($url);                        //将XML中的数据,读取到数组对象中

    $result = $xml_array->keyword->result;

    $data = array();

    foreach ($result->item as $key => $value) {

            array_push($data, (string)$value->kw);

    }

    if(count($data) > 0){

        return $data;

    }else{

        return false;

    }

 }

分词示例，通过url访问：

代码代码如下:

http://keyword.discuz.com/related_kw.html?title=高三历史全程复习精品教程&content=&ics=utf-8&ocs=utf-8

返回的XML数据：

<?xml version="1.0" encoding="utf-8" ?>

<total_response>

 <svalid>36000</svalid>

 <keyword>

 <info>

  <count>1</count>

  <errno>0</errno>

  <nextuptime>1291287160</nextuptime>

  <keep>0</keep>

 </info>

 <result>

  <item>

   <kw><![CDATA[高三历史]]></kw>

  </item>

 </result>

 </keyword>

</total_response>

参考：http://www.jb51.net/article/47952.htm

Discuz!在线中文分词服务的更多相关文章

Sina App Engine(SAE)入门教程(5)- SaeSegment(中文分词服务）使用
分词能干什么? 提取一篇文章的关键字检测特定的段落中有没有违禁词智能机器人 …..尽你所想开启SAE 分词服务首先你需要在sae的管理面板开始分词服务后才能使用sae的服务.具体的开启操作: ...
使用Discuz关键词服务器实现PHP中文分词
不同于使用自己的服务器进行分词,Discuz!在线中文分词服务是基于API返回分词结果的.在项目中,我们只需要一个函数即可方便地进行分词.关键词提取.以下是根据Discuz!在线分词服务API写的函数 ...
TNTSearch 轻量级全文索引 + 中文分词
TNTSearch 轻量级全文索引+中文分词选用 TNTSearch 的原因:轻,方便移植,不需要额外安装服务,能减少后期维护的工作量.搜索的效果也还不错,可以满足大多数项目场景,如果对性能和精准度 ...
中文分词接口api，采用结巴分词PHP版中文分词接口
中文分词,分词就是将连续的字序列按照一定的规范重新组合成词序列的过程.我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字.句和段能通过明显的分界符来简单划界,唯独词没有一个形式上 ...
solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件
昨天已经在Tomcat容器中成功的部署了solr全文检索引擎系统的服务:今天来分享一下solr服务在海量数据的网站中是如何实现数据的检索. 在solr服务中集成IKAnalyzer中文分词器的步骤: ...
新浪SAE中文分词接口
最近发现新浪SAE平台上竟然也提供分词功能,分词效果也还不错,由新浪爱问提供的分词服务,研究了一番,做了一个简易版的在线调用接口(get方式,非post) 官网说明:http://apidoc.sin ...
分词工具Hanlp基于感知机的中文分词框架
结构化感知机标注框架是一套利用感知机做序列标注任务,并且应用到中文分词.词性标注与命名实体识别这三个问题的完整在线学习框架,该框架利用1个算法解决3个问题,时自治同意的系统,同时三个任务顺序渐进,构 ...
elasticsearch 中文分词（elasticsearch-analysis-ik）安装
elasticsearch 中文分词(elasticsearch-analysis-ik)安装下载最新的发布版本 https://github.com/medcl/elasticsearch-ana ...
中文分词之结巴分词~~~附使用场景+demo（net）
常用技能(更新ing):http://www.cnblogs.com/dunitian/p/4822808.html#skill 技能总纲(更新ing):http://www.cnblogs.com/ ...

随机推荐

flask笔记三：flask-login插件的使用
flask-login插件的使用安装: pip install flask-login 初始化LoginManager ##############LoginManager设置########### ...
windows上memecache添加多个端口命令
sc create "Memcached Server1" start= auto binPath= "D:\01_Soft\memcached\memcached.ex ...
Django2.0之后使用外键时遇到 __init__() missing 1 required positional argument: 'on_delete'
1.Django2.0之后使用外键时遇到 __init__() missing 1 required positional argument: 'on_delete' 需要在外键创建时给on_dele ...
BZOJ3625: 小朋友和二叉树
传送门 Sol 设 \(f_x\) 表示权值为 \(x\) 的二叉树的个数设 \(s_x\) 表示是否有 \(x\) 这种权值可以选择那么 \[f_n=\sum_{i=0}^{n}\sum_{j= ...
Docker 核心概念、安装、端口映射及常用操作命令，详细到令人发指。
Docker简介 Docker是开源应用容器引擎,轻量级容器技术. 基于Go语言,并遵循Apache2.0协议开源 Docker可以让开发者打包他们的应用以及依赖包到一个轻量级.可移植的容器中,然后发 ...
jetty插件实现热部署
<plugin> <groupId>org.eclipse.jetty</groupId> <artifactId>jetty-maven-plugin ...
FineReport如何手动推送APP消息
在报表填报成功后,发送消息至APP会提示数据已更新.再次期间用户需要有查看该模板的权限,如果没有的话,则无法接受到提示信息.那么在FineReport移动端中,如何手动推送APP消息呢? 具体用法在 ...
Netty高性能web框架
框架背景: 前期为公司项目做全链路压测,发现公司跑到tomcat上的服务,即使是最简单的方法QPS也就到3000左右,后期查询发现可能和tomcat的业务逻辑有关. 因为以前在项目开发中用netty做 ...
CI框架去除index.php
打开apache的配置文件,conf/httpd.conf : LoadModule rewrite_module modules/mod_rewrite.so 把该行前的#去掉. 搜索 AllowO ...
Windows Azure系列公开课 - 第二课：为什么选择Windows Azure（上）
Windows Azure是微软的云平台,可以提供广泛服务.您可以通过它搭建.部署并管理解决方案,用于实现您可以想象的几乎任何目标.换言之,WindowsAzure是拥有无限可能的世界.无论您是需要运 ...

Discuz!在线中文分词服务

Discuz!在线中文分词服务的更多相关文章

随机推荐

热门专题