elasticsearch安装与使用(3)-- 安装中文分词插件elasticsearch-analyzer-ik
前言
elasticsearch(下面简称ES,安装ES点击这里)的自带standard分词只能把汉语分割成一个个字,而不能分词、分段,这就是我们需要分析器ik的地方了。
http://{ip}:9200/_analyze?analyzer=standard&pretty=true&text=sojson中华人民共和国

访问浏览器(虚拟机IP:9200)查看你elasticsearch的版本号

一、下载ik的相应版本
查看版本和下载链接点击这里
这里提供5.0.0的ES及以前的版本对应的ik版本

二、下载的方式
我这里的ES是2.3.5,对应的ik版本是1.9.5
在版本里选择1.9.5,点击 【Download ZIP】右键选择 -- 复制链接地址

wget https://github.com/medcl/elasticsearch-analysis-ik/archive/v1.9.5.zip
三、解包(如果没有unzip命令的使用 yum install zip unzip * 命令安装)
unzip v1.9.5.zip
四、 打包
因为是java的源码,需要用maven打包
进入解压后的目录elasticsearch-analysis-ik-1.10.1里面,输入下面命令进行打包
cd elasticsearch-analysis-ik-1.9./ mvn clean package
(注:如果没有mvn的可以直接使用 yum install java* 进行安装,把ES的环境也一起配置好)
五、配置
1、打包后,在当前目录下有target目录,进去,有一个releases目录,把里面的zip包复制到你安装ES目录下的plugins目录下的ik目录(ik目录需要手动添加)
我的ES插件路径是:/usr/share/elasticsearch/plugins/
mkdir -p /usr/share/elasticsearch/plugins/ik cd target/releases/ mv elasticsearch-analysis-ik-1.9.5.zip /usr/share/elasticsearch/plugins/ik
2、使用unzip命令解包,并把zip包删除了
cd /usr/share/elasticsearch/plugins/ unzip elasticsearch-analysis-ik-1.9..zip rm -rf elasticsearch-analysis-ik-1.9..zip
六、测试
重启ES服务,查看ES的状态为(Active: active (running))即可。
systemctl restart elasticsearch systemctl status elasticsearch
如果需要具体测试的话,可以在官网git的下面介绍有(点击查看),简单的方法可以使用下面命令在浏览器访问确认
http://(虚拟机ip):9200/_analyze?analyzer=ik&pretty=true&text=helloworld,中华人民共和国"

elasticsearch安装与使用(3)-- 安装中文分词插件elasticsearch-analyzer-ik的更多相关文章
- elasticsearch安装与使用(4)-- 安装中文分词插件elasticsearch 的 jdbc
前言 elasticsearch(下面简称ES)使用jdbc连接mysql比go-mysql-elasticsearch的elasticsearch-river-jdbc能够很好的支持增量数据更新的问 ...
- Ubuntu16.04下安装elasticsearch+kibana实现php客户端的中文分词
1.下载安装java, elasticsearch和kibana apt-get install default-jre default-jdk wget https://artifacts.elas ...
- ElasticSearch(三) ElasticSearch中文分词插件IK的安装
正因为Elasticsearch 内置的分词器对中文不友好,会把中文分成单个字来进行全文检索,所以我们需要借助中文分词插件来解决这个问题. 一.安装maven管理工具 Elasticsearch 要使 ...
- Elasticsearch安装中文分词插件ik
Elasticsearch默认提供的分词器,会把每一个汉字分开,而不是我们想要的依据关键词来分词.比如: curl -XPOST "http://localhost:9200/userinf ...
- ElasticSearch 中文分词插件ik 的使用
下载 IK 的版本要与 Elasticsearch 的版本一致,因此下载 7.1.0 版本. 安装 1.中文分词插件下载地址:https://github.com/medcl/elasticsearc ...
- Elasticsearch安装ik中文分词插件(四)
一.IK简介 IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包.从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本.最初,它是以开源项目Lu ...
- Elasticsearch如何安装中文分词插件ik
elasticsearch-analysis-ik 是一款中文的分词插件,支持自定义词库. 安装步骤: 1.到github网站下载源代码,网站地址为:https://github.com/medcl/ ...
- 【elasticsearch】(3)centos7 安装中文分词插件elasticsearch-analyzer-ik
前言 elasticsearch(下面简称ES,安装ES点击这里)的自带standard分词只能把汉语分割成一个个字,而不能分词.分段,这就是我们需要分析器ik的地方了. 一.下载ik的相应版本 查看 ...
- ElasticSearch-5.0.0安装中文分词插件IK
Install IK 源码地址:https://github.com/medcl/elasticsearch-analysis-ik,git clone下来. 1.compile mvn packag ...
随机推荐
- java中 this和super的差别
this表示当前调用方法的对象的引用: (谁调用这种方法,谁就是这个对象,这个this就是它的引用) 比方: <pre name="code" class="jav ...
- ScheduledThreadPoolExecutor的scheduleAtFixedRate方法探究
ScheduledThreadPoolExecutor除了具有ThreadPoolExecutor的所有功能外,还可以延迟执行任务或者周期性的执 行某个任务.scheduleWithFixedDela ...
- 算法笔记_137:二分图的最大匹配(Java)
目录 1 问题描述 2 解决方案 1 问题描述 何为二分图的最大匹配问题? 引用自百度百科: 首先得说明一下何为匹配: 给定一个二分图G,在G的一个子图M中,M的边集{E}中的任意两条边都不依附于 ...
- 解构赋值 和 symbol
1.数组解构 let [a,b,c,d] = ['aa','bb',77,88] 嵌套数组解构 let [a,b,[c,d],e] = ['aa','bb',[33,44],55] 空缺变量 let ...
- 〖Android〗K860/K860i CM10.2 Logcat
--------- beginning of /dev/log/main I/installd( 1377): installd firing up I/DEBUG ( 1370): debugger ...
- Linux-iptables详解
一:前言 防火墙,其实说白了讲,就是用于实现Linux下访问控制的功能的,它分为硬件的或者软件的防火墙两种.无论是在哪个网络中,防火墙工作的地方一定是在网络的边缘.而我们的任务就是需要去定义到底防 ...
- ubuntu12.04(64位)下安装Adobe Flash Player
2012-06-14 10:10:37 第一步,去adobe官方网站就可以,使用方便,打开网站:http://get.adobe.com/cn/flashplayer/根据自己的版本下载需要的.本 ...
- JavaScript编码转换之gb2312转unicode -- &#X形式
http://www.cnblogs.com/meil/archive/2007/01/31/635936.html JavaScript编码转换之gb2312转unicode 1. < ...
- TFS创建登录用户并连接TFS
简单使用 1.创建TFS组(Windows的组) 2.在“TFS管理控制台”中设置“组成员资格” 3.给“Team Foundation Administrators”组设置“属性” 4.给“Team ...
- C#:数据库操作(待补充)
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.D ...