Solr6.6 IK 中文分词的配置和使用

　　1. 首先，下载IKAnalyzer ，下载

　　2. 将ik的相关文件拷贝到 webapps\solr\WEB-INF\lib 目录下

　　　或者存放solr-6.6.0\server\solr\test\lib下面，就是在核test下面建立lib文件夹，把对应组件放在lib下面

　　修改solrconfig.xml，增加如下：

 <lib dir="./lib" regex=".*\.jar"/>

　　3. 在 solr-6.6.0\server\solr\test\conf\managed-schema增加如下配置

 <fieldType name="text_ik" class="solr.TextField">

    <analyzer type="index" >

      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>

      <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/CNstopwords.txt" />

    </analyzer>

    <analyzer type="query">

      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>

      <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/CNstopwords.txt" />

    </analyzer>

  </fieldType>

CNstopwords.txt为通用词文件

　　或

<!-- 我添加的IK分词 -->

         <fieldType name="text_ik" class="solr.TextField">

                   <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

                   <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

         </fieldType>

　　同时，把需要分词的字段，设置为text_ik，

  <field name="pathsummary"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />

  <field name="attr_content"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />

　　4、在admin后台， analysis 下查看分词效果

Solr6.6 IK 中文分词的配置和使用的更多相关文章

真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)
版权声明:本文为博主原创文章,转载请注明本文地址.http://www.cnblogs.com/o0Iris0o/p/5813856.html 内容介绍: 真分布式SolrCloud+Zookeepe ...
Solr学习总结（八）IK 中文分词的配置和使用
最近,很多朋友问我solr 中文分词配置的问题,都不知道怎么配置,怎么使用,原以为很简单,没想到这么多朋友都有问题,所以今天就总结总结中文分词的配置吧. 有的时候,用户搜索的关键字,可能是一句话,不是 ...
Solr5.5.1 IK中文分词配置与使用
前言用过Lucene.net的都知道,我们自己搭建索引服务器时和解决搜索匹配度的问题都用到过盘古分词.其中包含一个词典. 那么既然用到了这种国际化的框架,那么就避免不了中文分词.尤其是国内特殊行业比 ...
Solr6.6.0添加IK中文分词器
IK分词器就是一款中国人开发的,扩展性很好的中文分词器,它支持扩展词库,可以自己定制分词项,这对中文分词无疑是友好的. jar包下载链接:http://pan.baidu.com/s/1o85I15o ...
Solr7.2.1环境搭建和配置ik中文分词器
solr7.2.1环境搭建和配置ik中文分词器安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...
Solr学习笔记之2、集成IK中文分词器
Solr学习笔记之2.集成IK中文分词器一.下载IK中文分词器 IK中文分词器此文IK版本:IK Analyer 2012-FF hotfix 1 完整分发包二.在Solr中集成IK中文分词器 ...
2.IKAnalyzer 中文分词器配置和使用
一.配置 IKAnalyzer 中文分词器配置,简单,超简单. IKAnalyzer 中文分词器下载,注意版本问题,貌似出现向下不兼容的问题,solr的客户端界面Logging会提示错误. 给出我配置 ...
对本地Solr服务器添加IK中文分词器实现全文检索功能
在上一篇随笔中我们提到schema.xml中<field/>元素标签的配置,该标签中有四个属性,分别是name.type.indexed与stored,这篇随笔将讲述通过设置type属性的 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十九）ES6.2.2 安装Ik中文分词器
注: elasticsearch 版本6.2.2 1)集群模式,则每个节点都需要安装ik分词,安装插件完毕后需要重启服务,创建mapping前如果有机器未安装分词,则可能该索引可能为RED,需要删除后 ...

随机推荐

redis之（十八）redis的支持水平扩容的集群特性，以及插槽的相关操作
［一］主从集群的缺点,客户端分片的缺点 (1)主从+哨兵的redis集群,只是做主从备份,数据冗余的一种处理.但在存储空间的扩展上还是有限制.因为集群中的节点都是存储同样的数据.单一节点的容量,就可以 ...
redis之（十二）redis数据的持久化
［一］redis的数据为什么要持久化 --->redis的存取数据性能高,是由于将所有数据都存储在内存中.当redis重启的时候,存储在内存中的数据就容易丢失. --->把redis作为数 ...
git在window与linux的换行符问题
1:背景.我win7,后端是win10,使用了TortoiseGit工具.我使用ssh,他使用http.仓库是在linux,使用gitLab管理 2:问题.仓库是总监之前建好的.后端把文件add后pu ...
webpy 模版语言
webpy框架拥有自己的模版语言Templetor Templetor具有Python的语言风格可以直接嵌入Python代码 $code: videoIn = post.filename and p ...
ios 安卓 video 取消播放自动全屏属性
x-webkit-airplay="true",x5-playsinline="true",webkit-playsinline="true" ...
nodejs里的express自动刷新gulp-express使用【转载】
搬运自[http://blog.csdn.net/zhu_free/article/details/51476525] gulp-express实现实时刷新本来使用gulp-connect可以创建本 ...
centos7.5安装opendesktop
1.下载地址 http://gnome-look.org/ 2.安装 chmod +x opendesktop-app-3.1.3-1-x86_64.AppImage ./opendesktop-ap ...
zabbix通过jvm监控tomcat
说明:zabbix是通过jvm工具监控tomcat,zabbix server通过连接jvm代理服务器获取tomcat的各种参数 zabbix server:192.168.1.31 tomcat服务 ...
转：攻击JavaWeb应用[7]-Server篇[1]
转:http://static.hx99.net/static/drops/tips-604.html 攻击JavaWeb应用[7]-Server篇[1] 园长 · 2013/09/22 15:39 ...
POJ 3660 Cow Contest （dfs）
Cow Contest Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 11129 Accepted: 6183 Desc ...

Solr6.6 IK 中文分词的配置和使用

Solr6.6 IK 中文分词的配置和使用的更多相关文章

随机推荐

热门专题