xunsearch 迅搜初探】的更多相关文章

2014年1月2日 19:34:12 [root@localhost bin]# ./php /usr/local/lamp/xunsearch/sdk/php/util/Quest.php demo "俗话说 OR pid:1" 在 条数据中,大约有 条包含 俗话说 OR pid: ,第 - 条,用时:0.0036 秒. . 项目测试第三篇 ## [%,0.92] 俗话说,无三不成礼,所以就有了第三篇 Chrono: . 关于 xunsearch 的 DEMO 项目测试 ## [%,…
今天鼓捣了xunsearch,感觉官方指南写得挺详细,于是按照指南一步一步走,但是感觉越看越凌乱,像看API一样,新手看得特费劲,网上也少有新手教程,于是略过今天的歪路,记录一下我的安装步骤. Xunsearch PHP-SDK 是与 xunsearch 后端服务协同工作的,所以后先必须先在您的服务器 上安装服务端,服务器操作系统要求必须是 Linux.BSD 或其它类 UNIX 系统,同时安装了 gcc.make 等基础编译环境.[官文] 一,软件准备 PHP5.2.0以上,php已经配置到l…
安装与启动 http://www.xunsearch.com/doc/php/guide/start.installation 编写配置文件 http://www.xunsearch.com/doc/php/guide/ini.guide http://www.xunsearch.com/doc/php/guide/ini.first 导入的数据需要与配置文件对应,注意索引字段,最好有一个both索引,后面测试都是self索引会导致不模糊查找没有数据 project.name = magicbo…
1. sdk支持PHP 2. 针对mysql的某个库的某个表??进行索引,简单的说就是一个project,需要对应一个配置文件: 3. 分索引服务与搜索服务两个,另带中文分词功能:索引数据会有演示,但做外测试来说,可以用它自带的功能手动生成数据: 4. new XS('/pathto/xunsearch/etc/test.ini'); 实例化时似乎需要指定配置文件的绝对路径? 官方演示效果:http://www.xunsearch.com/demo/search.php?q=%E6%B0%B4%…
Xunsearch (迅搜)是一套免费开源的专业中文全文检索解决方案,简单易用而且 功能强大.性能卓越能轻松处理海量数据的全文检索.它包含后端索引.搜索服务程序和前端 脚本语言编写的开发工具包(称之为 SDK) .下面我们开始安装.进入linux服务器目录/www/wwwroot/xunsearch,输入 wget http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2 下载完成后执行解压命令 tar -xjf xunsea…
刚接触xunsearch(迅搜)的时候,我是排斥的.排斥的原因不是因为害怕学习新技术(其实我是对心技术很感兴趣),而是因为:一方面xunsearch是国人开发的,对于国人写的开源产品,我不是太感兴趣(可能是因为国产商品的原因,以后要逐步改掉这个毛病):另一方面是因为技术主管强烈推荐,他的推荐理由很简单,一是有相对详细的中文文档,看起来不那么吃力,二是xunsearch对中文分词支持较好,三是xunsearch可以直接部署在apache或者nginx下,与web服务器使用同一个服务器,避免了像so…
1.添加索引 $ cd /usr/local/xunsearch/sdk/php/ $ util/Indexer.php --rebuild --source=mysql://数据库用户名:数据库密码@数据库地址/数据库名 --sql="select * from 表名" --project=项目名 2.开启迅搜 $ cd /usr/local/xunsearch $ bin/xs-ctl.sh start 3.快速生成搜索应用 $ cd /usr/local/xunsearch/ $…
PHP+mysql数据库开发类似百度的搜索功能:中英文分词+全文检索 中文分词: a)   robbe PHP中文分词扩展: http://www.boyunjian.com/v/softd/robbe.html i.  Robbe完整版本下载:Robbe完整版本(PHP测试程序, 开发帮助文档, WinNT下php各版本的dll文件)下载: http://code.google.com/p/robbe(“谷歌”无法使用) b) SCWS(简易中文分词) 基于HTTP/POST的分词 : htt…
SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统). 这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词. 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点. SCWS 采用纯 C 语言开发,不依赖任何外部库函数,可直接使用动态链接库嵌入应用程序, 支持的中文编码包括 GBK.UTF-8 等.此外还提供了 PHP 扩展模块, 可在 P…
什么是模糊搜索?为什么要使用模糊搜索?相信大家都知道这些,我就不讲了.今天只讲怎么使用模糊搜索. 一 LIKE.大名鼎鼎的like字句,使用方便,兼容性好,易维护,但效率奇低.大家都会用,不多介绍. 二 MYSQL 原生支持的全文索引(FULLTEXT index).实现方式:首先给目标字段添加索引,索引的类型是FULLTEXT,然后查询的时候,在sql语句的where条件后面使用against()去指定关键字就好了.而网上很多文章对这个理解却有很多误区,认为FULLTEXT不支持中文,或者Li…