一、概要：

1.es默认的分词器对中文支持不好，会分割成一个个的汉字。ik分词器对中文的支持要好一些，主要由两种模式：ik_smart和ik_max_word
2.环境
操作系统：centos
es版本：6.0.0

二、安装插件

1.插件地址：https://github.com/medcl/elasticsearch-analysis-ik
2.运行命令行：

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.0.0/elasticsearch-analysis-ik-6.0.0.zip

运行完成后会发现多了以下文件：esroot 下的plugins和config文件夹多了analysis-ik目录。

三、重启es

1.查找es进程

ps -ef | grep elastic

2.终止进程
从上面的结果可以看到es进程号是12776.
执行命令：

kill 12776

3.启动es后台运行

./bin/sh elastic search –d

提醒：重启es会重新分片，线上环境要注意了。

四、测试

1.使用ik_max_word分词

GET _analyze

{

   "analyzer":"ik_max_word",

   "text":"中华人民共和国国歌"

}

分词结果：

{

   "tokens": [

     {

       "token": "中华人民共和国",

       "start_offset": 0,

       "end_offset": 7,

       "type": "CN_WORD",

       "position": 0

     },

     {

       "token": "中华人民",

       "start_offset": 0,

       "end_offset": 4,

       "type": "CN_WORD",

       "position": 1

     },

     {

       "token": "中华",

       "start_offset": 0,

       "end_offset": 2,

       "type": "CN_WORD",

       "position": 2

     },

     {

       "token": "华人",

       "start_offset": 1,

       "end_offset": 3,

       "type": "CN_WORD",

       "position": 3

     },

     {

       "token": "人民共和国",

       "start_offset": 2,

       "end_offset": 7,

       "type": "CN_WORD",

       "position": 4

     },

     {

       "token": "人民",

       "start_offset": 2,

       "end_offset": 4,

       "type": "CN_WORD",

       "position": 5

     },

     {

       "token": "共和国",

       "start_offset": 4,

       "end_offset": 7,

       "type": "CN_WORD",

       "position": 6

     },

     {

       "token": "共和",

       "start_offset": 4,

       "end_offset": 6,

       "type": "CN_WORD",

       "position": 7

     },

     {

       "token": "国",

       "start_offset": 6,

       "end_offset": 7,

       "type": "CN_CHAR",

       "position": 8

     },

     {

       "token": "国歌",

       "start_offset": 7,

       "end_offset": 9,

       "type": "CN_WORD",

       "position": 9

     }

   ]

}

2.使用ik_smart分词

GET _analyze

{

   "analyzer":"ik_smart",

   "text":"中华人民共和国国歌"

}

分词结果：

{

   "tokens": [

     {

       "token": "中华人民共和国",

       "start_offset": 0,

       "end_offset": 7,

       "type": "CN_WORD",

       "position": 0

     },

     {

       "token": "国歌",

       "start_offset": 7,

       "end_offset": 9,

       "type": "CN_WORD",

       "position": 1

     }

   ]

}

五、java api分词测试

1.调用ik_max_word分词

@Test

public void analyzer_ik_max_word() throws Exception {

     java.lang.String text = "提前祝大家春节快乐！";

    TransportClient client = EsClient.get();

     AnalyzeRequest request = (new AnalyzeRequest()).analyzer("ik_max_word").text(text);

     List<AnalyzeResponse.AnalyzeToken> tokens = client.admin().indices().analyze(request).actionGet().getTokens();

     System.out.println(tokens.size());//

     for (AnalyzeResponse.AnalyzeToken token : tokens) {

         System.out.println(token.getTerm() + " ");

     }

}

结果：

6

提前

祝

大家

春节快乐

春节

快乐

2.调用ik_smart分词

@Test

public void analyzer_ik_smart() throws Exception {

     java.lang.String text = "提前祝大家春节快乐！";

    TransportClient client = EsClient.get();

     AnalyzeRequest request = (new AnalyzeRequest()).analyzer("ik_smart").text(text);

     List<AnalyzeResponse.AnalyzeToken> tokens = client.admin().indices().analyze(request).actionGet().getTokens();

     System.out.println(tokens.size());

     for (AnalyzeResponse.AnalyzeToken token : tokens) {

         System.out.println(token.getTerm() + " ");

     }

}

结果：

4

提前

祝

大家

春节快乐

elasticsearch安装ik分词器的更多相关文章

windows下elasticsearch安装ik分词器后无法启动
windows下elasticsearch安装ik分词器后启动报如下图错误: 然后百度说是elasticsearch路径有空格,一看果然我的路径有空格,然后重新换个路径就好了.
elasticsearch安装ik分词器（极速版）
简介:下面讲有我已经打包并且编辑过的zip包,你可以在下面下载即可. 1.下载zip包.elasticsearch-analysis-ik-1.8.0.jar下面有附件链接[ik-安装包.zip],下 ...
elasticsearch安装ik分词器（非极速版）
1.下载下载地址为: https://github.com/medcl/elasticsearch-analysis-ik 2.解压把下载的 elasticsearch-analysis-ik.zip ...
Elasticsearch入门之从零开始安装ik分词器
起因需要在ES中使用聚合进行统计分析,但是聚合字段值为中文,ES的默认分词器对于中文支持非常不友好:会把完整的中文词语拆分为一系列独立的汉字进行聚合,显然这并不是我的初衷.我们来看个实例: POST ...
Elasticsearch下安装ik分词器
安装ik分词器(必须安装maven) 上传相应jar包解压到相应目录 unzip elasticsearch-analysis-ik-master.zip(zip包) cp -r elasticse ...
如何给Elasticsearch安装中文分词器IK
安装Elasticsearch安装中文分词器IK的步骤: 1. 停止elasticsearch 2.2的服务 2. 在以下地址下载对应的elasticsearch-analysis-ik插件安装包(版 ...
【ELK】【docker】【elasticsearch】1. 使用Docker和Elasticsearch+ kibana 5.6.9 搭建全文本搜索引擎应用集群,安装ik分词器
系列文章:[建议从第二章开始] [ELK][docker][elasticsearch]1. 使用Docker和Elasticsearch+ kibana 5.6.9 搭建全文本搜索引擎应用集群,安 ...
Linux下,非Docker启动Elasticsearch 6.3.0,安装ik分词器插件,以及使用Kibana测试Elasticsearch,
Linux下,非Docker启动Elasticsearch 6.3.0 查看java版本,需要1.8版本 java -version yum -y install java 创建用户,因为elasti ...
ElasticSearch安装中文分词器IK
1.安装IK分词器,下载对应版本的插件,elasticsearch-analysis-ik中文分词器的开发者一直进行维护的,对应着elasticsearch的版本,所以选择好自己的版本即可.IKAna ...

随机推荐

线上服务器上安装的VNCServer不能正常工作
1.问题描述: 线上服务器上安装的不能正常工作 2.解决问题过程: 一. 重启vncserver 运行命令:vncserver -kill :1和vncserver :1 二. 发现vncserver ...
【链表】BZOJ1588: [HNOI2002]营业额统计
1588: [HNOI2002]营业额统计 Time Limit: 5 Sec Memory Limit: 162 MBSubmit: 17555 Solved: 7179[Submit][Sta ...
Jerry的ABAP, Java和JavaScript乱炖
写这个系列的初衷是SAP Chengdu office有越来越多的应届毕业生加入,这些新同事通过在大学的专业学习,具备了Java和JavaScript背景,但是进入SAP之后大家觉得ABAP没有Jav ...
flask动态url规则
动态URL规则 URL规则可以添加变量部分,也就是件更符合同规则的URL抽象成一个URL模式. @app.route('/item/<id>') def item(id): return ...
【易语言学习】Day1
个人认为网上讲的都不是很好,查阅了各类资料,特意找了份比较不错的PDF版,需要的可以私聊我~~~ 今天就看到这里了,请听下回分解
BZOJ:4873: [Shoi2017]寿司餐厅
4873: [Shoi2017]寿司餐厅首先很开心在膜你赛的时候做了出来. 看到数据范围,看到不能dp,看到贡献去重后计算,咦,流? 那就容易了,转最大权闭合子图,每个区间建一个点,取了就一定要取他 ...
Codeforces Round #331 (Div. 2) _A. Wilbur and Swimming Pool
A. Wilbur and Swimming Pool time limit per test 1 second memory limit per test 256 megabytes input s ...
NEFU_117素数个数的位数
题目传送门:点击打开链接 Problem : 117 Time Limit : 1000ms Memory Limit : 65536K description 小明是一个聪明的孩子,对数论有着很浓烈 ...
android组件化方案、二维码扫码、Kotlin新闻客户端、动画特效等源码
Android精选源码 CalendarView日历选择器 android下拉刷新动画效果代码一个非常方便的fragment页面框架 android组件化方案源码 Zxing实现二维码条形码的扫描和 ...
说说 typedef 的那些事
最近在复习数据结构时,经常看到 typedef 的身影,但始终不清楚 typedef 的用法具体时怎么样的,特地查阅<C Primer Plus 第5版>,并将查到的内容写出来供大家沟通学 ...

elasticsearch安装ik分词器