对本地Solr服务器添加IK中文分词器实现全文检索功能

在上一篇随笔中我们提到schema.xml中<field/>元素标签的配置，该标签中有四个属性，分别是name、type、indexed与stored，这篇随笔将讲述通过设置type属性的值实现中文分词的检索功能

首先下载IK中文分词项目，下载地址https://code.google.com/archive/p/ik-analyzer/downloads?page=1，

　　

其中除了含有jar包之外，还有三个相关的配置文件

　　

　　第一步，将IKAnalyzer2012FF_u1.jar添加到项目的WEB-INF\lib目录下

　　

　　第二步，将IKAnalyzer.cfg.xml与stopword.dic添加到项目的classes目录下

　　

其中的ext.dic文件可手动进行扩展字典配置，在IKAnalyzer.cfg.xml配置文件中，我们可以看到对应的配置
<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">

<properties>

    <comment>IK Analyzer 扩展配置</comment>

    

    <entry key="ext_dict">ext.dic;</entry> 

    

    <entry key="ext_stopwords">stopword.dic;</entry> 

</properties>
第三步，也就是最重要的一步，需要在schema.xml文件中配置分词类型

　　
<fieldType name="text_ik" class="solr.TextField">

      <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

      <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

   </fieldType>

 配置完成后，启动本地服务，在Analysis菜单页中可以实现分词测试

 这样我们在自定义field时，对需要分词的字段，则将其type属性值设为fieldType的name值即可实现分词检索　

再这里再记录下，在schema.xml中两个会用到的另外两个标签，uniqueKey与solrQueryParser

uniqueKey用来设置主键名称，默认为id
solrQueryParser用来设置分词时对字段的查询条件and与or，默认是or且被注释掉，当为and时，需要这个字段中包含输入的关键字分词后，所有的数据才能匹配成功

对本地Solr服务器添加IK中文分词器实现全文检索功能的更多相关文章

Solr6.6.0添加IK中文分词器
IK分词器就是一款中国人开发的,扩展性很好的中文分词器,它支持扩展词库,可以自己定制分词项,这对中文分词无疑是友好的. jar包下载链接:http://pan.baidu.com/s/1o85I15o ...
Solr学习笔记之2、集成IK中文分词器
Solr学习笔记之2.集成IK中文分词器一.下载IK中文分词器 IK中文分词器此文IK版本:IK Analyer 2012-FF hotfix 1 完整分发包二.在Solr中集成IK中文分词器 ...
真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)
版权声明:本文为博主原创文章,转载请注明本文地址.http://www.cnblogs.com/o0Iris0o/p/5813856.html 内容介绍: 真分布式SolrCloud+Zookeepe ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十九）ES6.2.2 安装Ik中文分词器
注: elasticsearch 版本6.2.2 1)集群模式,则每个节点都需要安装ik分词,安装插件完毕后需要重启服务,创建mapping前如果有机器未安装分词,则可能该索引可能为RED,需要删除后 ...
Solr7.2.1环境搭建和配置ik中文分词器
solr7.2.1环境搭建和配置ik中文分词器安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...
ElasticSearch速学 - IK中文分词器远程字典设置
前面已经对”IK中文分词器“有了简单的了解: 但是可以发现不是对所有的词都能很好的区分,比如: 逼格这个词就没有分出来. 词库实际上IK分词器也是根据一些词库来进行分词的,我们可以丰富这个词库. ...
ES-Mac OS环境搭建-ik中文分词器
下载从github下载ik中文分词器,点击地址,需要注意的是,ik分词器和elasticsearch版本必须一致. 安装下载到本地并解压到elasticsearch中的plugins目录内即可. ...
ES[7.6.x]学习笔记（七）IK中文分词器
在上一节中,我们给大家介绍了ES的分析器,我相信大家对ES的全文搜索已经有了深刻的印象.分析器包含3个部分:字符过滤器.分词器.分词过滤器.在上一节的例子,大家发现了,都是英文的例子,是吧?因为ES是 ...
elasticsearch使用ik中文分词器
elasticsearch使用ik中文分词器一.背景二.安装 ik 分词器 1.从 github 上找到和本次 es 版本匹配上的分词器 2.使用 es 自带的插件管理 elasticsearc ...

随机推荐

docker网络访问（三）
docker网络访问 ifconfig查看网卡,启动docker的时候,docker会帮我们创建一个docker0的网桥. 1.随机映射 docker run -P 2.指定映射 -p hostPor ...
Java解析JSON文件的方法（二）
assets文件夹资源的访问 assets文件夹里面的文件都是保持原始的文件格式,需要用AssetManager以字节流的形式读取文件. 1. 先在Activity里面调用g ...
JDBC oracle 错误总结
ORA-28040: No matching authentication protocol jdk:1.8 oracle:12c 使用ojdbc14.jar 报错:ORA-28040: No mat ...
1.1.Core Data是什么（Core Data 应用程序实践指南）
Core Data是个框架,把数据当作对象来操作. 由Core Data提供的数据对象叫托管对象(managed objecgt),而Core Data 位于程序和持久化存储区之间. 托管对象模型里有 ...
iframe截取网站部分内容实现思路及代码
使用iframe可以截取网站的部分内容,主要配合width.height.overflow等属性来实现的,具体示例如下,需要的朋友不要错过. <div style="width:630 ...
在delphi中，DLL加载时做初始化的Demo
library DLLEntry;//dll源码 uses SysUtils, Classes, Dialogs, Windows; {$R *.res} procedure DLLEntryPoin ...
JVM内存划分基础知识
第一部分 JVM内存划分目录 Java垃圾回收概况 Java内存区域 Java对象的访问方式 Java内存分配机制 Java GC机制垃圾收集器 Java垃圾回收概况 Java GC(Garbag ...
line-height系列——定义和工作原理总结
一.line-height的定义和工作原理总结 line-height的属性值: normal 默认设置合理的行间距. number 设置数字,此数字会与当前的字体尺寸相乘来设置行间距li ...
（一）Hololens Unity 开发环境搭建(Mac BOOTCAMP WIN10)
(一)Hololens Unity 开发环境搭建(Mac BOOTCAMP WIN10) 系统要求 64位 Windows 10 除了家庭版的都支持 ~ 64位CPU CPU至少是四核心以上~ 至少 ...
Android内存泄露---检测工具篇
内存使用是程序开发无法回避的一个问题.如果我们毫不在意肆意使用,总有一天会为此还账,且痛不欲生...所以应当防患于未然,把内存使用细化到平时的每一行代码中. 内存使用概念较大,本篇先讲对已有app如何 ...

对本地Solr服务器添加IK中文分词器实现全文检索功能

在上一篇随笔中我们提到schema.xml中<field/>元素标签的配置，该标签中有四个属性，分别是name、type、indexed与stored，这篇随笔将讲述通过设置type属性的值实现中文分词的检索功能

对本地Solr服务器添加IK中文分词器实现全文检索功能的更多相关文章

随机推荐

热门专题