ThinkPHP自动获取关键词调用在线discuz词库

先按照下图路径放好插件

        /**
* 自动获取关键词(调用第三方插件)
* @return [type] [description]
* www.shouce.ren
*/
public function keyword()
{
Vendor('autokeyword.AutoKeyword');
$keyword = new \AutoKeyword();
$str='自动获取关键词并发大数据我们大家好吃饭啦调用第三方插件';
$title = trim($str);
$keys=$keyword::discuz($title);
var_dump($keys);
}

插件源码:

AutoKeyword.php

<?php

/**
* 分词
* @author zhao jinhan <326196998@qq.com>
*
*/
class AutoKeyword
{ /**
* 使用discuz词库
* @param unknown_type $title
* @param unknown_type $content
*/
public static function discuz ($title = '', $content = '')
{
$subjectenc = rawurlencode(strip_tags($title));
$messageenc = rawurlencode(strip_tags(preg_replace("/\[.+?\]/U", '', $content)));
$data = @implode('', file("http://keyword.discuz.com/related_kw.html?title=$subjectenc&content=$messageenc&ics=utf-8&ocs=utf-8")); if ($data) {
$parser = xml_parser_create();
xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);
xml_parse_into_struct($parser, $data, $values, $index);
xml_parser_free($parser);
$kws = array ();
foreach ($values as $valuearray) {
if ($valuearray['tag'] == 'kw' || $valuearray['tag'] == 'ekw')
$kws[] = trim($valuearray['value']);
}
// $return = '';
// $dot='';
// if ($kws) {
// foreach ($kws as $kw) {
// $kw = CHtml::encode(strip_tags($kw));
// $return .= $dot.$kw ;
// $dot = ',';
// }
// $return = trim($return);
// } return $kws;
} }
/**
* 简易自定义获取关键词
* @param string $title
* @param string $content
* @return JSON
*/
public static function simple($title = '', $content=''){
$words = include_once dirname(__FILE__).DIRECTORY_SEPARATOR.'words.php';
$data = array();
$max = 10; //最多匹配10个
if($words){
foreach((array)$words as $word){
if(count($data) > $max){
break;
}else{
if($title && preg_match('/'.$word.'/is', $title)){
array_push($data, $word);
}
if($content && preg_match('/'.$word.'/is', $content)){
if(!in_array($word, $data)){
array_push($data, $word);
}
}
}
}
}
return array_unique($data);
} }

word.php

<?php
/**
* 词库(权重越高越靠前)
*/
return array(
'php',
'mysql',
'web',
'html',
'js',
'jquery',
'sql',
'myisam',
'innodb',
'apache',
'nginx',
'yii',
'linux',
'cms',
'yiifcms',
'redis',
'memcache',
'explain',
'ueditor',
'kindeditor',
'api',
'w3c',
'高性能',
'大数据',
'存储过程',
'事物',
'触发器',
'索引',
'并发',
'编程',
'算法',
'排序',
'安装包',
'下载',
'服务器',
'手册',
'指南',
'文章',
'图集',
);

ThinkPHP3.2.3扩展之自动分词获取关键字的更多相关文章

  1. JMeter 扩展JMeter插件获取更多监听器

    扩展Jmeter插件获取更多监听器 by:授客 QQ:1033553122 为了获取更多监听器,方便的监控系统及应用,有必要安装第三方插件. 插件下载地址: https://jmeter-plugin ...

  2. easyui tree扩展tree方法获取目标节点的一级子节点

    Easyui tree扩展tree方法获取目标节点的一级子节点 /* 只返回目标节点的第一级子节点,具体的用法和getChildren方法是一样的 */ $.extend($.fn.tree.meth ...

  3. C#枚举扩展方法,获取枚举值的描述值以及获取一个枚举类下面所有的元素

    /// <summary> /// 枚举扩展方法 /// </summary> public static class EnumExtension { private stat ...

  4. ThinkPHP3.2.3扩展之生成PDF文件(MPDF)

    目前是PHP生成PDF文件最好的插件了,今天介绍下在ThinkPHP3.2.3里如何使用. 先安照路径放好如图. 下面是使用方法 public function pdf(){ //引入类库 Vendo ...

  5. ThinkPHP3.2 行为扩展以及插件机制介绍!

    首先行为扩展这个概念是TP架构的核心组成之一,关于行为的解释我就粗略的概括一下吧:TP在从接受到HTTP请求到最终将视图输出,期间经历的很多步骤,这些步骤大家可以在http://document.th ...

  6. Chome——扩展程序,获取更多扩展程序报错

    修改/替换hosts文件 地址:c:/windows/system32/drivers/etc hosts:可从网上搜索下载或网盘下载(链接: http://pan.baidu.com/s/1bpu6 ...

  7. 扩展1 - Python 获取当前时间的用法

    1.先导入库:import datetime 2.获取当前日期和时间:now_time = datetime.datetime.now() 3.格式化成我们想要的日期:strftime() 比如:“2 ...

  8. WebAPI的AuthorizeAttribute扩展类中获取POST提交的数据

    在WEBAPI中,AuthorizeAttribute类重写时,如何获取post数据是个难题,网上找资料也不好使,只能自己研究,通过研究发现,WEBAPI给了我们获取POST数据的可能,下面介绍一下: ...

  9. C#.NET为List加入扩展方法:获取唯一值

    public static class ListTools { /// <summary> /// 获取唯一值列表 /// </summary> /// <param n ...

随机推荐

  1. Python 之多线程应用

    import socket from threading import Thread def recv_data(): while True: recv_info = udp_socket.recvf ...

  2. Cesium学习笔记(四)Camera ----http://blog.csdn.net/hobhunter/article/details/74909641

    Cesium 相机控制场景中的视野.操作相机的方法有很多,如旋转,缩放,平移和飞到目的地.Cesium具有默认的鼠标和触摸事件处理程序与相机进行交互,还有一个API以编程方式操纵相机. 我们可以使用该 ...

  3. Linux 下phpstudy的安装使用补充说明

    (1)使用方法 在终端中使用sudo 或者 使用管理员账号运行 phpstudy start 开启 (2)命令列表: phpstudy start | stop | restart        开启 ...

  4. C# 后台POST提交方式

    1.第一种方式:用最新框架,但是针对IIS服务器的操作系统有关系,非R2的收不到数据: using (var reqConts = new MultipartFormDataContent()) { ...

  5. windows上关闭Nagle算法

    下面的设置可以调整或禁用 nagel 算法.禁用 nagel 算法以后, 允许很小的包没有延迟立即发送.建议对某些游戏关闭 nagel 算法, 这样做对文件传输/吞吐量有负面影响.默认状态( 开启na ...

  6. cmake更新版本简记

    问题描述: 由于需求,要在服务器上安装ANTs(Advanced Normalization Tools).然而最新版的ANTs需要下载源码并用cmake编译, 于是根据https://github. ...

  7. Tomcat启动失败--Several ports (8005, 8080, 8009)

    启动Tomcat服务器报错: Several ports (8005, 8080, 8009) required by Tomcat v7.0 Server at localhost are alre ...

  8. Vue动态组件&异步组件

    在动态组件上使用keep-alive 我们之前曾经在一个多标签的界面中使用is特性来切换不同的组件: Vue.js的动态组件模板 <component v-bind:is="curre ...

  9. hdu 5182 PM2.5

    问题描述 目前,我们用PM2.5的含量来描述空气质量的好坏.一个城市的PM2.5含量越低,它的空气质量就越好.所以我们经常按照PM2.5的含量从小到大对城市排序.一些时候某个城市的排名可能上升,但是他 ...

  10. [bzoj3339]Rmq Problem||[bzoj3585]mex_线段树

    Rmq Problem bzoj-3339||mex bzoj-3585 题目大意:给定一个长度为n的数列a,多次讯问区间l,r中最小的不属于集合{$A_l,A_{l+1}...A_r$}的非负整数. ...