coreseek 基与Sphinx 的全文索引

假设有两张那个表，分别为articles,article_photos两张表。搜索的时候，要匹配articles.title、articles.intro、article_photos.caption这三个字段。

PHP页面



header("content-type:text/html;charset=utf8");

include './sphinxapi.php'; //包含sphinxapi类

$sphinx = new SphinxClient(); //实例化

$sphinx->SetServer('localhost', 9312);//链接

$sphinx->SetLimits(0, 1000, 1000); //默认匹配20条记录。加上这行表示匹配1000条记录。（可用于分页）

$res = $sphinx->Query("暴动", "*");//查询的字段第二参数是你配置文件里面写得规则这里是*就会匹配所有规则

echo "<pre>";

print_r($res['matches']);

coreseek.conf 内容配置如下

#源定义

#mysql类只实现连接数据库

source mysql {

    type                    = mysql

    sql_host                = localhost

    sql_user                = root

    sql_pass                =

    sql_db                  = nextmgz_archive

    sql_port                = 3306

    sql_query_pre           = SET NAMES utf8

    # 命令行查询时，设置正确的字符集

    sql_query_info_pre      = SET NAMES utf8

}

# 继承mysql

source articles : mysql

{

    #sql_query第一列id需为整数

    #title、content作为字符串/文本字段，被全文索引

    sql_query                = SELECT art_id,title,intro FROM articles

    # 从SQL读取到的值必须为整数

    sql_attr_uint            = art_id

    # 从SQL读取到的值必须为整数，作为时间属性

    # sql_attr_timestamp        = date_added

    # 命令行查询时，从数据库读取原始数据信息

    sql_query_info          = SELECT * FROM articles WHERE art_id=$id

}

#index定义

index articles

{

    # 对应的source名称

    source           = articles

    #请修改为实际使用的绝对路径，例如：/usr/local/coreseek/var/

    path             = E:/__Work/coreseek-4.1-win32/var/data/articles

    docinfo          = extern

    mlock            = 0

    morphology       = none

    min_word_len     = 1

    html_strip       = 0

    #中文分词配置，详情请查看：http://www.coreseek.cn/products-install/coreseek_mmseg/

    #charset_dictpath = /usr/local/mmseg3/etc/ #BSD、Linux环境下设置，/符号结尾

    charset_dictpath    = E:/__Work/coreseek-4.1-win32/etc/ #Windows环境下设置，/符号结尾，最好给出绝对路径，例如：C:/usr/local/coreseek/etc/...

    charset_type        = zh_cn.utf-8

}

source article_photos : mysql

{

    sql_query               = SELECT art_id,caption FROM article_photos

    sql_attr_uint           = art_id

    sql_query_info       = SELECT * FROM article_photos WHERE art_id=$id

}

index article_photos

{

    source           = article_photos

    path              = E:/__Work/coreseek-4.1-win32/var/data/article_photos

    docinfo          = extern

    mlock            = 0

    morphology       = none

    min_word_len     = 1

    html_strip       = 0

    charset_dictpath = E:/__Work/coreseek-4.1-win32/etc/ #Windows环境下设置，/符号结尾，最好给出绝对路径，例如：C:/usr/local/coreseek/etc/...

    charset_type     = zh_cn.utf-8

}

#全局index定义

indexer

{

    mem_limit            = 128M

}

#searchd服务定义

searchd

{

    listen              = 9312

    read_timeout        = 5

    max_children        = 30

    max_matches         = 1000

    seamless_rotate     = 0

    preopen_indexes     = 0

    unlink_old          = 1

    pid_file            = E:/__Work/coreseek-4.1-win32/var/log/searchd_mysql.pid    #请修改为实际使用的绝对路径，例如：/usr/local/coreseek/var/...

    log                 = E:/__Work/coreseek-4.1-win32/var/log/searchd_mysql.log    #请修改为实际使用的绝对路径，例如：/usr/local/coreseek/var/...

    query_log           = E:/__Work/coreseek-4.1-win32/var/log/query_mysql.log      #请修改为实际使用的绝对路径，例如：/usr/local/coreseek/var/...

    binlog_path         =                                                       #关闭binlog日志

}

建立索引。启动服务

# 建立所有索引（或者执行下面两条）

E:/__Work/coreseek-4.1-win32/bin/indexer -c E:/__Work/coreseek-4.1-win32/bin/coreseek.conf --all --rotate

# 建立指定索引

E:/__Work/coreseek-4.1-win32/bin/indexer -c E:/__Work/coreseek-4.1-win32/bin/coreseek.conf articles

E:/__Work/coreseek-4.1-win32/bin/indexer -c E:/__Work/coreseek-4.1-win32/bin/coreseek.conf article_photos

# sphinx啟動

E:/__Work/coreseek-4.1-win32/bin/searchd -c E:/__Work/coreseek-4.1-win32/bin/coreseek.conf

coreseek 基与Sphinx 的全文索引的更多相关文章

Sphinx 与全文索引
全文索引创建过程第一步:将源文档传给分词组件(Tokenizer) 分词组件做了以下事情: 将文档分成一个一个的单词去除标点符号去除停词:英文(the / a / this / that ... ...
sphinx + mysql 全文索引配置
参考地址 http://v9.help.phpcms.cn/html/2010/search_0919/35.html http://blog.sina.com.cn/s/blog_705e4fdc0 ...
Sphinx(coreseek) 安装使用以及词库的扩展
1.Sphinx(coreseek) 是啥一般而言,Sphinx是一个独立的全文搜索引擎:而Coreseek是一个支持中文的全文搜索引擎,意图为其他应用提供高速.低空间占用.高结果相关度的中文全文搜 ...
sphinx（coreseek）——1、增量索引
首先介绍一下 CoreSeek/Sphinx的发布包 indexer: 用于创建全文索引; search: 一个简单的命令行(CLI) 的测试程序,用于测试全文索引; search ...
安装sphinx和coreseek
sphinx简介 Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.意图为其他应用提供高速.低空间占用.高结果相关度的全文搜索功能.Sphinx可以非常容易的与SQL数 ...
sphinx,coreseek安装
sphinx是国外的一款搜索软件. coreseek是在sphinx的基础上,增加了中文分词功能,换句话说,就是支持了中文. Coreseek发布了3.2.14版本和4.1版本,其中的3.2.14版本 ...
centos+php+coreseek+sphinx+mysql之二sphinx配置篇
先进入文件夹进行以下操作 cd /usr/local/coreseek/etc cp sphinx.conf.dist sphinx.conf source src1 { sql_host = 127 ...
Coreseek/sphinx全文检索的了解
Coreseek/sphinx全文检索的了解概述: 全文检索是一种将文件里全部文本与检索项匹配的文字资料检索方法,全文检索是将存储于数据库中整本书.整篇文章中的随意内容信息查找出来的检索.它能够依据 ...
Centos下Sphinx中文分词编译安装测试---CoreSeek
要支持中文分词,还需要下载Coreseek,可以去官方搜索下载,这里我用的4.1 百度云下载地址: https://pan.baidu.com/s/1slNIyHf tar -zxvf co ...

随机推荐

Spring Boot集成Shiro实战
Spring Boot集成Shiro权限验证框架,可参考: https://shiro.apache.org/spring-boot.html 引入依赖 <dependency> < ...
23-Ubuntu-文件和目录命令-查看文件内容-more 和 cat
1. more---适合查看内容多的文件格式: more 文件名操作键功能空格键显示手册页下一屏 Enter键一次滚动手册页的一行 b 返回上一屏 f 前滚一屏 q 退出例: more ...
springcloud（十六）：服务网关 zuul 快速入门
服务网关是微服务架构中一个不可或缺的部分.通过服务网关统一向外系统提供REST API的过程中,除了具备服务路由.均衡负载功能之外,它还具备了权限控制等功能.Spring Cloud Netflix中 ...
一个很SB的方法，来开始调一个刚启动就SB的程序
自己鼓捣的方法,累死我了... 遇到一个程序,这程序启动之后,会自动重新启动我的电脑, 我想调试它一下,但是遇到了问题, 如果我用调试器附加上去的话,电脑是不重起了,但是它启动了之后会立刻黑屏,全黑, ...
Maven IntelliJ IDEA设置
参考:博客地址: https://blog.csdn.net/huo920/article/details/82082403 Maven常用配置在配置之前请将JDK安装好. 1. 环境变量配置添加 ...
ASP.NET打开项目错误：将指定的计数添加到该信号量中会导致其超过最大计数。
1.错误如图 2.解决方案重启IIS即可,运行-> 输入IISRESET 命令即可重启IIS,如图
NLP杂点
1.停用词 stop words: 在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词. 停用词都是人工输入.或者由一个停用词表导入. 2.jieba是目前最好的 Python 中文分词组件 ...
PHP算法之删除最外层的括号
有效括号字符串为空 ("")."(" + A + ")" 或 A + B,其中 A 和 B 都是有效的括号字符串,+ 代表字符串的连接.例如 ...
Android开发 AndroidStudio解决Error:moudle not specified
问题描述在使用Android Studio 进行Builder APKs的时候,如果发现无法degub, 进行配置的时候没有module可以进行指定问题原因项目未与Grade Files 文件 ...
css----less预处理器
###less less是一种动态样式语言,属于css预处理器的范畴,它扩展了 CSS 语言, 增加了变量.Mixin.函数等特性,使 CSS 更易维护和扩展 LESS 既可以在客户端上运行 ,也 ...

coreseek 基与Sphinx 的全文索引

PHP页面

coreseek.conf 内容配置如下

建立索引。启动服务

coreseek 基与Sphinx 的全文索引的更多相关文章

随机推荐

热门专题