实践中 XunSearch（讯搜）更新索引方案对比

检测PHP－SDK的运行条件（查看是否支持XunSearch） $prefix/sdk/php/util/RequiredCheck.php $prefix #替换成你的安装目录

使用 XunSearch（讯搜）有很多种使用方法和更新索引的方法；

搜索语法
• 查询语句和流行的搜索引擎相似，通过空格把搜索词、句连接起来即可，字段检索使用 field:XXX 的格式。
• 允许使用 AND/OR/NOT/XOR 等显式地布尔关系组合，可以使用小括号 () 包围表达优先级。
• 支持使用双引号对较长搜索词进行精确匹配，要求字段设计时勾选“精确”项。
$search->search(‘ 杭州西湖’); // 搜索同时包含这2个词的结果
$search->search(‘ 杭州 OR 西湖’); // 搜索包含其中一个词的结果
$search->search(‘subject:杭州西湖’); // 包括西湖并且标题包含杭州的结果
获取结果
• 设置数量及偏移
$search->setLimit(5, 15); // 设置最多返回 5 条，并跳过前 15 条，即返回第 16-20 条结果
• 获取搜索结果

$docs = $search->setQuery(‘ 测试’)->search();  //  搜索 ‘ 测试’

   foreach ($docs as $doc) {

       $subject = $search->highlight($doc->subject); //  高亮处理标题

       echo $doc->rank() . ‘. ‘ . $subject . ‘ [‘ . $doc->percent() . ‘%] - ‘ . date(‘Y-m-d’) . “n”;

       echo $doc->message . “nn”;

   }

　• 获取搜索结果数量 ( 估算值)

$count = $search->getLastCount(); // 获取最后一次 $search->search() 的匹配数量
$count = $search->count(‘测试’); // 直接检索包含 ‘ 测试’ 的数量　

热门搜索

　　　　通过 XSSearch::getHotQuery  方法获取热门搜索词，返回的数组以关键词为键名，搜索指数为值。

  　　 $words = $search->getHotQuery(); //  获取前 6 个总热门搜索词

  　　 $words = $search->getHotQuery(6, ‘lastnum’); //  获取前 10 个上周热门词

　　相关搜索

　　　　通过 XSSearch::getRelatedQuery  方法获取热门搜索词，返回相关搜索词组成的数组。

   　　$words = $search->getRelatedQuery(); //  获取前 6 个和最近一次 setQuery()  相关的搜索词

   　　$words = $search->getRelatedQuery(‘测试’, 10);  //  获取 10 个和 ‘ 测试’  相关的搜索词

　　　搜索纠错

　　　　由于输入过快或拼音输入中文很容易出现错误，XSSearch::getCorrectedQuery 方法返回纠正后的关键词组成的数组。 　　　　

　　　　$docs = $search->setQuery(‘ 侧试’)->search();  //  正常进行搜索误打的 ‘ 侧试’

   　　  $corrected = $search->getCorrectedQuery(); //  尝试修正

   　　 if (count($corrected) > 0) { // 有修正词则列出

       　　echo “ 您是不是要找：n”;

      　　 foreach ($corredted as $word) echo $word . “n”;

  　　 }　　　 

　　搜索建议

　　　　类似常见搜索引擎那样，当用户在输入框键入少量字、拼音、声母时进行智能补全，可以节省用户的输入时间。

   　　$words = $search->getExpandedQuery(‘c’); //  返回 array(‘ 测试’)

  　　 $words = $search->getExpandedQuery(‘ 测’); //  返回 array(‘ 测试’)

  　　　 $words = $search->getExpandedQuery(‘cs’);  //  返回 array(‘ 测试’)

附加XunSearch搜索结果code

#引入接口文件，其实你懂的，就是一个类

require './lib/XS.php';   //  引入 xunsearch sdk

if(isset($_POST['sub']) && $_POST['keyword'] != ''){

     $keyword = trim($_POST['keyword']);    //接收关键词

     $xs = new XS('source');    // demo  为项目名称，配置文件是：$sdk/app/demo.in i

      //$index = $xs->index;   //  获取索引对象

      $search = $xs->search;   //  获取搜索对象

      $search->setLimit(20);

      $docs = $search->setQuery( $keyword)->search();  //  搜索 ‘ 测试’

     echo "<table border='1' bordercolor='green' cellspacing='0'><tr><th>标题</th></tr>";

      foreach ($docs as $doc) {

               $subject = $search->highlight($doc->product_name); //  高亮处理标题

            echo "<tr><td>".$subject."</td></tr>";

      }

       echo "</table>";  

     // $search->setQuery($keyword);

     // 获取前 6 个和默认搜索语句 "西湖" 相关搜索词

    // $words = $search->getRelatedQuery();

    // print_r($words);

最常见的就有批量更新和增量更新索引，话不多说，直接看代码；

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝单独更新索引＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

1－ 添加文档 （就是直接添加单条数据记录到索引库中）

$xs = new XS('njw');

$index = $xs->index;

$data = array(

'pid' => 234, // 此字段为主键，必须指定

'subject' => '测试文档的标题',

'message' => '测试文档的内容部分',

'chrono' => time()

);

//创建文档对象

$doc = new XSDocument;

$doc->setFields($data);

//添加到索引数据库中

$index->add($doc);

2－更新文档（其中$data里必须包含有主键字段，这样索引库才会被更新成功）

$xs = new XS('njw');

$index = $xs->index;

$data = array(

'pid' => 234, // 此字段为主键，必须指定

'subject' => '测试文档的标题',

'message' => '测试文档的内容部分',

'chrono' => time()

);

//创建文档对象

$doc = new XSDocument;

$doc->setFields($data);

//更新到索引数据库中

$index->update($doc);

附加其它索引操作说明：

$index->add($doc); // 添加文档，不检测便索引库内是否已有同一主键数据

$index->update($doc); // 更新文档，若有同主键数据则替换之

$index->del(‘123’); // 删除主键值为 234 的文档

$index->del(array(‘123’,‘456’)); // 删除主键值为 123 及 456 的文档

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝批量更新＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

3－ 平滑批量重建更新索引 （批量更新索引，）

header('Content-Type:text/html;charset=utf-8;');

require_once '../../../local/xunsearch/sdk/php/lib/XS.php';

include "./mysql_conn.php";

try{

$xs = new XS('njw');

//平滑重建索引

//宣布开始重建索引

$xs->index->beginRebuild();

$sql = "select g.id id,g.title title,g.norms norms,i.picture picture from b2b_goods g INNER JOIN b2b_goods_images i ON g.id=i.goods_id limit";

$result = $db->query($sql);

while( $row = $result -> fetch_assoc ()) {

$doc = new XSDocument;

$doc->setFields($row);

//添加到索引数据库中

$xs->index->add($doc);

$xs->index->update($doc);

}

//告诉服务器重建索引完成

$xs->index->endRebuild();

}catch(XSException $e){

echo $e;

}

4 － 使用缓冲区批量重建更新索引 （批量更新操作）

header('Content-Type:text/html;charset=utf-8;');

require_once '../../../local/xunsearch/sdk/php/lib/XS.php';

include "./mysql_conn.php";

try{

    $xs = new XS('njw');

    //使用索引缓冲区

    $xs->index->openBuffer();

    $sql = "select g.id id,g.title title,g.norms norms,i.picture picture from b2b_goods g INNER JOIN b2b_goods_images i ON g.id=i.goods_id";

    $result = $db->query($sql);

    while( $row = $result -> fetch_assoc ()) {

        $doc = new XSDocument;

        $doc->setFields($row);

        //添加到索引数据库中

        $xs->index->add($doc);

        $xs->index->update($doc);

    }

    //告诉服务器重建索引完成

    $xs->index->closeBuffer();

}catch(XSException $e){

    echo $e;

}

清空索引和索引同步

当搜索字段文件变更或出现严重不同步时，建议清空索引。

 // 当搜索字段文件变更或出现严重不同步时，建议清空索引。

 $index->clean(); //  一执行立即生效

索引同步

出于性能优化设计，上面所看到的索引操作都是异步操作。也就是说您通过 PHP  调用的 API 返回后，索引变动是先保存在服务端的队列中，由服务端根据负荷延迟一并写入索引库。这个时间差我们控制在合理范围内，通常是几秒钟时间。但如果您在批量更新后希望立即同步，可以这样：

$index->flushIndex();

实践中 XunSearch（讯搜）更新索引方案对比的更多相关文章

实践中 XunSearch（讯搜）的使用教程步骤
XunSearch(讯搜)的使用教程步骤一.安装编译工具 yum install make gcc g++ gcc-c++ libtool autoconf automake imake mysql ...
空间搜索（圆范围）中Geohash编码方案和网格编码方案对比探讨
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1.背景多个项目中实现范围(圆)搜索的方案为:依赖库表中的X和Y字段构 ...
JAVA面试中问及HIBERNATE与 MYBATIS的对比，在这里做一下总结
我是一名java开发人员,hibernate以及mybatis都有过学习,在java面试中也被提及问道过,在项目实践中也应用过,现在对hibernate和mybatis做一下对比,便于大家更好的理解和 ...
JAVA面试中问及HIBERNATE与 MYBATIS的对比，在这里做一下总结(转)
hibernate以及mybatis都有过学习,在java面试中也被提及问道过,在项目实践中也应用过,现在对hibernate和mybatis做一下对比,便于大家更好的理解和学习,使自己在做项目中更加 ...
unity 热更方案对比
现在一般使用的方案有:tulua&ulua.xlua.ILRuntime 对比: tulua&ulua 方案成熟,稳定第三方库支持 xlua 之前是为了热更修复线上bug的,腾讯发起的 ...
[硬件项目] 2、汽车倒车雷达设计——基于专用倒车雷达芯片GM3101的设计方案与采用CX20106A红外线检测芯片方案对比
前言尽管每辆汽车都有后视镜,但不可避免地都存在一个后视镜的盲区,倒车雷达则可一定程度帮助驾驶员扫除视野死角和视线模糊的缺陷,提高驾驶安全性.上一节已经分析清倒车雷达的语音模块(上一节),本节将深入分 ...
大规模Hadoop集群实践：腾讯分布式数据仓库（TDW）
TDW 是腾讯最大的离线数据处理平台.本文主要从需求.挑战.方案和未来计划等方面,介绍了TDW在建设单个大规模集群中采取的 JobTracker 分散化和 NameNode 高可用两个优化方案. TD ...
实践中总结——理解haslayout和BFC
1.HASLAYOUT 首先,haslayout翻译成中文就是:有布局. 所谓布局,指的是一个元素可以对本身和里边的元素进行尺寸计算和定位.这里只是谈IE6/7,据说微软之所以不是对所有元素默认有布局 ...
谈谈在DevOps实践中，感觉最重要的这三个技术……
从国内众多DevOps实践中,我们能看到下面三个技术尤其重要和火热: 容器:容器从根本上解决了软件对环境的依懒性,解决了各个环境之间的差异问题:它可以加速部署的速度,提高部署的效率:降低部署的成本.容 ...

随机推荐

Game Engine Architecture 5
[Game Engine Architecture 5] 1.Memory Ordering Semantics These mysterious and vexing problems can on ...
spring cloud Ribbon
参考:https://www.jianshu.com/p/1bd66db5dc46 Ribbon 是什么 spring cloud ribbon 是一个基于HTTP 和 TCP 的客户端负载均衡工具, ...
python之全局变量与局部变量
全局变量: - 在书写中顶格开始: - 一旦定义完毕在整个文件生效: - 在函数内如果定义了同名全局变量名,会“覆盖”掉全局变量: - 在函数中同名的变量,当在函数退出后消失,全局的同 ...
动态在线扩容root根分区大小的方法详解
前言本文主要介绍了关于动态在线扩容root根分区大小的相关内容,分享出来供大家参考学习,下面话不都说了,来一起看看详细的介绍吧. ? 1 qemu-img resize yourname.img + ...
Cocos2dx开发之设计模式
cocos2dx的几种常见设计模式一单例模式 Cocos2dx中的单例有:CCDirector,CCTextureCache,CCSpriteFrameCache,CCScriptEngineMa ...
mysql 2pc理解
Ubuntu 增加swap空间大小
1. create a 1G file for the swap. sudo fallocate -l 1G /swapfile we can verify that the correct amou ...
Unity 3D 如何修改新建脚本中的 C# 默认创建的 Script 脚本格式
首先在Unity的安装路径下找到 Unity5\Editor\Data\Resources\ScriptTemplates路径的(81-C# Script-NewBehaviourScript.cs. ...
websocket初识
一.官网官网地址:http://www.websocket.org/ 二.websocket初识demo <input id="sendTxt" type="te ...
The web application registered the JDBC driver * but failed to unregister it when the web application was stopped. To prevent a memory leak, the JDBC Driver has been forcibly unregistered.
最近使用了最新版的tomcat9,使用jdbc链接mysql数据库.关闭tomcat过程中出现警告 13-Sep-2017 22:22:54.369 WARNING [main] org.apache ...

实践中 XunSearch（讯搜）更新索引方案对比

实践中 XunSearch（讯搜）更新索引方案对比的更多相关文章

随机推荐

热门专题