Elasticsearch使用系列-ES增删查改基本操作+ik分词
Elasticsearch使用系列-ES增删查改基本操作+ik分词
一、安装可视化工具Kibana
ES是一个NoSql数据库应用。和其他数据库一样,我们为了方便操作查看它,需要安装一个可视化工具 Kibana。
官网:https://www.elastic.co/cn/downloads/kibana

和前面安装ES一样,选中对应的环境下载,这里选择windows环境,注意安装的版本一定要和ES的版本一致,不然可能会启动不起来。
解压后进到config目录下修改kibana.yml配置文件


修改完配置,进入bin目录,双击 kibana.bat 文件启动。
启动后,打开kibana地址:http://localhost:5601/ ,出现下面界面就是安装成功了。

点自己浏览进入下面

点开发工具进入操作ES的界面,我们ES就在下面界面操作。

二、ES数据结构和数据类型
1.ES数据结构
这里以Mysql作对比,ES7.0以前的结构是Index,Type,Document,ES7.0以后废弃了Type,现在ES和Mysql的结构对比如下
| MySql | Elasitcsearch |
| database(数据库) | Elasitcsearch(实例) |
| table(表) | index(索引) |
| row(行) | document(文档) |
| column(列) | field(字段) |
2.ES数据类型
- 字符串:text,keyword (重点类型)
- 数值:long,integer,short,byte,double,float,half float,scaled float
- 日期类型:date
- 布尔类型:boolean
- 二进制类型:binary
- 等等。。。
这里的数据类型标红的是ES的重点类型,其它的和平时开发的类型一样,没什么特别。
三、ES的增删查改基本操作
| 请求方式 | url地址 | 描述 |
| PUT | http://localhost:9200/索引名称 | 创建索引 |
| POST | http://local | |
1.创建索引,相当于数据库创建表
PUT index

PUT user
{
"mappings" : {
"properties" : {
"age" : {
"type" : "integer"
}, "name" : {
"type" : "text"
},
"name2" : {
"type" : "keyword"
},
"name3" : {
"type" : "text",
"fields" : {
"keyword" : {
"type" : "keyword",
"ignore_above" : 256
}
}
},
"hobby" : {
"type" : "text"
}
}
}
}

这里说一下kibana执行的原理,kibana执行的是http请求,前面的PUT为请求方式,还有POST,GET等,后面的user是索引名称,因为kibana配置了es的信息,
所以会自动带上es的地址和端口,实际的请求为 PUT http://192.168.101.13:9200/user
查看索引字段信息
GET index

2.创建文档,相当于数据库插入数据记录
POST index/_doc/id (index:索引名称,_doc:固定,id:指定记录id,不填会自动生成一个唯一id)

4.查询
4.1查询全部
GET index/_search

4.2按条件查询
GET user/_search
{
"query": {
"term": {
"FIELD": {
"value": "VALUE"
}
}
}
}

5.更新
对应sql语句:update user set age=19 where id=1
_doc,doc,_update:固定写法

6.删除
6.1删除文档(相当于删除一条数据)
对应sql语句: delete from user where id=1
DELETE user/_doc/1
6.2删除索引(相当于删除表)
对应sql语句:drop table user
DELETE user
四、全文索引和ik分词
1.全文索引

创建索引的时候我上面故意创建了name(text),name1(keyword),name2(text+keyword),然后数据类型也说了text,keyword是ES的重点类型,这里演示他们的区别。
- keyword类型:查询时条件只能全匹配
- text类型:全文索引查询,查询时会先分词,然后用分词去匹配查询
- keyword+text类型,一个字段两种类型,可以全匹配,也可以全文索引查询
keyword查询例子,name2(keyword)的查询:
keyword的查询用term,或terms(配置多个值)


因为是全匹配,条件”张三“查到数据,条件”张“时查不到数据。
text查询例子,name(text)的查询
text的查询用match


因为是全文索引分词匹配,所以条件“张三”和条件“张”的,都把匹配到的数据都查询出来了。
keyword+text查询例子,name3(text+keyword)的查询。
当只想查全匹配时,用term查询

当想用全文索引查询时,用match

2.ik分词
1.什么是分词?

我搜的是爱祖国,为什么,“爱钓鱼,爱唱歌"的都被搜出来了呢?
因为ES默认内置了一个分词器standard,看下这个分词器的分词结果

可以看到“爱祖国”的分词结果为“爱,祖,国”,被拆分成了单个字,只要一个字匹配到就查出来,这样的结果很多不是我们想要的。我们需要一款根据常用词语的分词器,这样查到的结果会更准确,
这里就用到了ik分词,ik分词也是企业开发用的最多的。
2.ik分词器插件安装
官网下载:https://github.com/medcl/elasticsearch-analysis-ik/releases
下载的版本要和es一致。

把文件下载后,解压复制到es部署文件的plugins文件夹下,并把文件夹的名称改为ik,必须要叫ik。windows,linux,docker(docker为挂载文件夹的方式把文件映射进去)一样,
然后重启es即可生效。

再看一下用ik分词器的分词结果。

可以看到,已经是按常用词语分词了。
3.自定义词组
上面“爱祖国”,被分成“爱祖国,祖国”,假如我想“爱组”也是一个词,现在这个词没被收怎么办?
打开刚才的ik文件夹下的config目录

里面的.dic结尾的都是分词,打开其中一个看一下。

所以我们要自定义词语,可以新建一个myword.dic
里面写上想要的分词


然后在IKAnalyzer.cfg.xml文件加上刚才的文件名

重启es,再看一下分词结果。

4.ik分词怎么在索引中使用
创建索引的时候,text类型如果没指定使用分词器,就会默认内置的分词器,所以使用ik分词器时,创建索引时需要指定。

PUT user2
{
"mappings" : {
"properties" : {
"age" : {
"type" : "integer"
}, "name" : {
"type" : "text" },
"name2" : {
"type" : "keyword"
},
"name3" : {
"type" : "text",
"fields" : {
"keyword" : {
"type" : "keyword",
"ignore_above" : 256
}
},
"analyzer": "ik_max_word",
"search_analyzer": "ik_max_word"
},
"hobby" : {
"type" : "text",
"analyzer": "ik_max_word",
"search_analyzer" : "ik_max_word"
}
}
}
}

把user的数据复制到user2。

再次查询“爱祖国”,得到一条想要的数据,没有多余数据。证明ik分词在索引中生效了。

Elasticsearch使用系列-ES增删查改基本操作+ik分词的更多相关文章
- MongoDB的增删查改基本操作
MongoDB的增删查改基本操作 先决条件建库.建集合.建文档 连接mongo,如果连接不上什么连接拒绝,输入mongod命令,启动服务后 输入mongo show dbs 显示当前的所有的数据库 一 ...
- Elasticsearch学习系列一(部署和配置IK分词器)
Elasticsearch简介 Elasticsearch是什么? Elaticsearch简称为ES,是一个开源的可扩展的分布式的全文检索引擎,它可以近乎实时的存储.检索数据.本身扩展性很好,可扩展 ...
- 6.在MVC中使用泛型仓储模式和依赖注入实现增删查改
原文链接:http://www.c-sharpcorner.com/UploadFile/3d39b4/crud-operations-using-the-generic-repository-pat ...
- 3.EF 6.0 Code-First实现增删查改
原文链接:http://www.c-sharpcorner.com/UploadFile/3d39b4/crud-operations-using-entity-framework-5-0-code- ...
- 4.在MVC中使用仓储模式进行增删查改
原文链接:http://www.c-sharpcorner.com/UploadFile/3d39b4/crud-using-the-repository-pattern-in-mvc/ 系列目录: ...
- 5.在MVC中使用泛型仓储模式和工作单元来进行增删查改
原文链接:http://www.c-sharpcorner.com/UploadFile/3d39b4/crud-operations-using-the-generic-repository-pat ...
- Sql Server的艺术(一) 视图的增删查改
视图是从一个或者多个表中查询数据的另一种方式.利用视图可以集中.简化定制数据库,同时还能保障安全. 视图其结构和数据是建立在对应的查询基础上的.和表一样,视图也是包括几个被定义的数据列和多个数据行,但 ...
- Android SQLite最简单demo实现(增删查改)
本来不太想写这篇博客的,但是看到网上的关于android数据库操作的博文都讲得很详细,对于像我这样的新手入门了解SQLite的基本操作有一定难度,所以我参考了网上的一些博客文章,并自己亲自摸索了一遍, ...
- 在MVC中使用泛型仓储模式和工作单元来进行增删查改
原文链接:http://www.c-sharpcorner.com/UploadFile/3d39b4/crud-operations-using-the-generic-repository-pat ...
随机推荐
- qt5之设置无边窗口移动
Note qt version: 5.12 qt creator: 4.13 本文将介绍 设置无边窗口和设置窗口的移动 你要知道: QDialog 和 QMainWindow都是 QWidget的派生 ...
- lldb调试C++总结(1)
Note 好记性不如烂笔头.时间一长,lldb的基本功快忘本了. 本文将介绍使用 lldb 调试 C++程序的基本用法. 演示基于 Ubuntu + lldb lldb + clang(++) 版本 ...
- 【LeetCode】226. Invert Binary Tree 翻转二叉树(Python)
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 递归 迭代 日期 题目地址: https://lee ...
- 【LeetCode】1022. Smallest Integer Divisible by K 解题报告(Python)
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 日期 题目地址:https://leetcode.c ...
- 【LeetCode】747. Largest Number At Least Twice of Others 解题报告(Python)
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 寻找两次最大值 排序 大顶堆 日期 题目地址:htt ...
- 基于内存的关系数据库memsql初探
背景 广告系统中,算法模型预估需要根据广告的实时转化统计结果,才能做出更精准的预估:同时,支持多维度聚合查询(例如按照广告各个不同层级维度,按照时间不同粒度的维度),并跨大区合并.一开始的版本是基于m ...
- Netty 中的心跳机制
在TCP长连接或者WebSocket长连接中一般我们都会使用心跳机制–即发送特殊的数据包来通告对方自己的业务还没有办完,不要关闭链接. 网络的传输是不可靠的,当我们发起一个链接请求的过程之中会发生什么 ...
- 强强联袂!腾讯云TDSQL与国双战略签约,锚定国产数据库巨大市场
日前,腾讯云计算(北京)有限责任公司与北京国双科技有限公司签署了<国产数据库产品战略合作协议>,双方将在数据库技术方面展开深度合作,通过分布式交易型数据库的联合研发.产品服务体系建设.品牌 ...
- Java初学者作业——编写Java程序,实现判断所输入字符的类型(数字、小写字母、大写字母或其他字符)
返回本章节 返回作业目录 需求说明: 编写Java程序,实现判断所输入字符的类型(数字.小写字母.大写字母或其他字符) 实现思路: 声明变量c,用于存储用户输入的字符. 通过Scanner接收用户输入 ...
- docker学习:docker安装
Centos7 安装docker 下载安装 yum install docker-ce 启动docker systemctl start docker 创建并编写镜像加速文件 vim /etc/doc ...