ElasticSearch7.10.0入门学习
ElasticSearch完成最关键的一个功能就是 大数据搜索
官网:https://www.elastic.co/cn/elasticsearch/
简介
Elasticsearch 是一个分布式全文检索引擎
Lucene、Solr、ElasticSearch
- Lucene
- 是一套信息搜索工具jar包
- 包括了:索引结构、读写索引的工具、排序、搜索规则等等工具类
- 注意:不包括搜索引擎系统
- Solr
- 是基于Lucene做了一些封装和增强
- 通过对外提供Web-service的API接口
- ElasticSearch
- 是基于Lucene做了一些封装和增强
- 通过简单的Restful来隐藏Lucene的复杂性
安装
windows安装es
环境:jdk1.8及以上
在官网中可以进行下载,但是因为是外网,速度是极其的慢。而且可能安装失败,所以我们可以通过官网找到你要下载的版本,然后通过华为云镜像去下载。(下方链接)
ElasticSearch: https://mirrors.huaweicloud.com/elasticsearch/?C=N&O=D
在windows上安装es,很方便解压即可使用
解压的目录结构如下

bin 启动文件
config 配置文件
log4j 日志配置文件
jvm.options java虚拟机相关配置
elasticsearch.yml es配置文件 默认:9200端口
lib 相关jar包
log 日志
modules 功能模块
plugins 插件 比如ik分词器
启动
双击bin\elasticsearch.bat

在网页中就可以访问 http://localhost:9200/

安装可视化界面 elasticsearch-head
除了下面的安装方法,你也可以在谷歌浏览器中安装插件elasticsearch head
环境:nodejs
下载地址:https://github.com/mobz/elasticsearch-head
下载完成后,尽量将ElasticSearch相关工具放在统一目录下
cd elasticsearch-head #到路径下
npm install -g nrm #全局安装nrm 如果没有安装过安装一下
nrm use taobao #切换镜像
npm install #安装依赖
npm run start #启动项目
启动
在网页中就可以访问 http://localhost:9200/
但是,出现了跨域问题

在elasticsearch.yml文件中配置,解决跨域。注意由于yml的格式问题,冒号后面需要加空格。
修改好配置文件之后重新启动elasticsearch
http.cors.enabled: true
http.cors.allow-origin: "*"

安装kibana
kibana可以将elasticsearch的数据通过友好的界面展示出来,提供实时的分析功能。
官网下载慢,和elasticsearch一样的解决方法,华为云镜像:https://mirrors.huaweicloud.com/kibana/?C=N&O=D
注意:需要保证版本和elasticsearch的版本一致
下载完成后,尽量将ElasticSearch相关工具放在统一目录下
启动
双击bin目录下的kibana.bat
如果说,你在英文方面不太擅长,kibana是支持汉化的
编辑器打开kibana解压目录/config/kibana.yml,添加如下,然后冲洗kibana
i18n.locale: "zh-CN"
直接修改配置就可以实现汉化的原因是在kibana-7.10.0-windows-x86_64\x-pack\plugins\translations\translations中存在了zh-CN.json
ES核心概念
elasticsearch是面向文档。一切都是json。
传统的关系型数据库和elasticsearch进行对比
| DB | ElasticSearch |
|---|---|
| 数据库 database | 索引 indices |
| 表 tables | types |
| 行 rows | 文档 documents |
| 字段 columns | fields |
elasticsearch中可以包含多个索引(数据库),每个索引中可以包含多个类型(表),每个类型下又包含多个文档(行),每个文档中又包含多个字段(列)。
IK分词器
分词:即把一段中文或者别的划分成一个个的关键字,默认的中文分词是将每个字看成一个词(不使用用IK分词器的情况下)。但是,这显然是不符合要求的,所以我们需要安装中文分词器ik来解决这个问题。
IK提供了两个分词算法: ik_smart和ik_max_word ,其中ik_smart为最少切分, ik_max_word为最细粒度划分!
下载
版本要与ElasticSearch版本对应
下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases
安装
加压即可(但是我们需要解压到ElasticSearch的plugins目录下),然后压缩包进行删除
重启elasticsearch,可以看到加载了插件

测试
使用kibana的开发工具进行测试,注意:kibana开发工具执行的时候,需要将鼠标选中当前行,然后点击运行


从上面的例子中,感觉分词都比较正常,但是大多数,分词都满足不了我们的想法,如下例

那么,我们需要手动将该词添加到分词器的词典当中
添加自定义的词添加到扩展字典中
elasticsearch目录/plugins/elasticsearch-analysis-ik-7.10.0/config/IKAnalyzer.cfg.xml
我们会看到下面的内容
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict"></entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords"></entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
将扩展字典进行修改,然后在和IKAnalyzer.cfg.xml的相同目录下,新建一个my.dic,添加字典
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">my.dic</entry>

重启ElasticSearch,再次使用kibana测试
可以看到加载了my.dic


Rest风格
基本Rest命令说明
| method | url地址 | 描述 |
|---|---|---|
| PUT(创建,修改) | localhost:9200/索引名称/类型名称/文档id | 创建文档(指定文档id) |
| POST(创建) | localhost:9200/索引名称/类型名称 | 创建文档(随机文档id) |
| POST(修改) | localhost:9200/索引名称/类型名称/文档id/_update | 修改文档 |
| DELETE(删除) | localhost:9200/索引名称/类型名称/文档id | 删除文档 |
| GET(查询) | localhost:9200/索引名称/类型名称/文档id | 查询文档通过文档ID |
| POST(查询) | localhost:9200/索引名称/类型名称/文档id/_search | 查询所有数据 |
基本操作
1、创建一个索引,添加
PUT /test1/type1/1
{
"name":"DJ同学",
"age":22
}


2、字段数据类型
- 字符串类型:text、keyword
- 数值型:long、Integer、short、byte、double、float、half float、scaled float
- 日期类型:date
- 布尔类型:boolean
- 二进制类型:binary
- ...
3、指定字段的类型(使用PUT)
类似于建库(建立索引和字段对应类型),也可看做规则的建立
PUT /test2
{
"mappings":{
"properties":{
"name":{
"type":"text"
},
"age":{
"type":"long"
},
"birthday":{
"type":"date"
}
}
}
}

4、获取3建立的规则
GET test2
5、获取默认信息
_doc默认类型(default type),type 在未来的版本中会逐渐弃用,因此产生一个默认类型进行代替
PUT /test3/_doc/1
{
"name":"DJ同学",
"age":22,
"birthday":"2021-01-01"
}
GET test3


7、删除
删除索引 DELETE /索引名/~类型名~/文档id 根据需求来判断是删除索引还是删除文档记录!
DELETE test1
8、新增数据
PUT /test4/user/1
{
"name":"张三",
"grade":"大一"
}
9、修改数据
你可以使用put的创建命令,直接覆盖。下面提供了最新的修改方法
POST /test4/user/3/_update
{
"doc":{
"name":"赵四"
}
}
10、简单查询数据
GET /test4/user/2
GET /test4/user/_search?q=name:"张三"
11、复杂的查询select(排序,分页,高亮,模糊查询,精准查询)
test4索引中的内容如下

查询匹配
- sort 只能用于数字类型,而且所有的score会变成null
- _source 过滤字段,默认显示所有字段
GET /test4/user/_search
{
"query":{
"match": {
"name":"三三"
}
}
,"_source": ["name","desc"]
,"sort":[
{
"age":{
"order":"asc"
}
}]
,"from": 0
,"size": 1
}

多条件查询(bool)
must相当于andshould相当于ormust_not相当于not (... and ...)filter过滤
GET /test4/user/_search
{
"query":{
"bool":{
"must":[
{
"match":{
"name":"三"
}
}
,
{
"match":{
"age":9
}
}
]
}
}
}
GET /test4/user/_search
{
"query":{
"bool":{
"must":[
{
"match":{
"name":"三"
}
}
]
,"filter":{
"range": {
"age": {
"gte": 0,
"lte": 20
}
}
}
}
}
}
精确查询
term直接通过 倒排索引 指定词条查询- 适合查询 number、date、keyword ,不适合text
GET /test4/user/_search
{
"query": {
"term": {
"name":"张三"
}
}
}
高亮查询
GET test4/user/_search
{
"query": {
"match": {
"name":"张三"
}
}
,
"highlight": {
"fields": {
"name": {}
}
}
}
// 自定义前缀和后缀
GET test4/user/_search
{
"query": {
"match": {
"name":"张三"
}
}
,
"highlight": {
"pre_tags": "<p class='key' style='color:red'>",
"post_tags": "</p>",
"fields": {
"name": {}
}
}
}
集成springboot
Java High Level REST Client 高级客户端api测试
官网学习api:https://www.elastic.co/guide/en/elasticsearch/client/java-rest/7.x/java-rest-high.html
包括了索引和文档的CRUD,代码es-api https://gitee.com/dz138598/elasticsearch-study/tree/master/
实战
代码:https://gitee.com/dz138598/elasticsearch-study/tree/master/jd-project

ElasticSearch7.10.0入门学习的更多相关文章
- Bootstrap3.0入门学习系列
Bootstrap3.0入门学习系列规划[持续更新] 前言 首先在此多谢博友们在前几篇博文当中给与的支持和鼓励,以及在回复中提出的问题.意见和看法. 在此先声明一下,之前在下小菜所有的随笔文章中, ...
- Json.Net6.0入门学习试水篇
原文:Json.Net6.0入门学习试水篇 前言 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.简单地说,JSON 可以将 JavaScript 对象中 ...
- Bootstrap3.0入门学习系列教程
可视化布局:http://www.runoob.com/try/bootstrap/layoutit/ 1.浏览器兼容性:你可以去看看大牛的一篇文章http://www.cnblogs.com/lhb ...
- 【数据售卖平台】—— Vue2.0入门学习项目爬坑
前言:这个项目是我从零学习Vue2.0时用于练习基础知识的入门项目,包含了Vue2.0几乎所有项目都会用到的基础功能,是新手用来练手的好项目,这里温故知新对功能点做一个总结.github地址:http ...
- webpack3.10.0(入门系列基本概念1)
一.概念 webpack的核心是一个用于现代JavaScript应用程序的静态模块打包程序.当webpack处理您的应用程序时,它会递归地构建一个依赖图,其中包含应用程序所需的每个模块,然后将所有这些 ...
- Bootstrap3.0入门学习系列规划[持续更新]
详情请看http://aehyok.com/Blog/Detail/5.html 个人网站地址:aehyok.com QQ 技术群号:206058845,验证码为:aehyok 本文文章链接:http ...
- Protege5.0.0入门学习
OWL本体的重要组成部分 Individuals:个体,代表一个领域里面的对象.可以理解成一个类的实例(instances of classes). Properties:属性,是两个个体之间的双重联 ...
- Elasticsearch7.X 入门学习第九课笔记-----聚合分析Aggregation
原文:Elasticsearch7.X 入门学习第九课笔记-----聚合分析Aggregation 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. ...
- Elasticsearch7.X 入门学习第三课笔记----search api学习(URI Search)
原文:Elasticsearch7.X 入门学习第三课笔记----search api学习(URI Search) 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出 ...
随机推荐
- uniCloud的简单使用 增删改查
新建一个uni-app 项目 启动云开发 选择想要的云服务 在次之前先完成uniCloud 的实名认证 https://unicloud.dcloud.net.cn 有在Web控制台创建过云服务空间就 ...
- Mysql给外网IP授权访问
GRANT ALL PRIVILEGES ON *.* TO 'root'@'58.221.44.174' IDENTIFIED BY 'njqt123456' WITH GRANT OPTION; ...
- 输入一个字符串,按字典序打印出该字符串中字符的所有排列。例如输入字符串abc,则打印出由字符a,b,c所能排列出来的所有字符串abc,acb,bac,bca,cab和cba。
题目描述 输入一个字符串,按字典序打印出该字符串中字符的所有排列.例如输入字符串abc,则打印出由字符a,b,c所能排列出来的所有字符串abc,acb,bac,bca,cab和cba. 输入描述: 输 ...
- java实现一个点餐系统
转载于blog.csdn.net/weixin_44219955 项目大体框架 菜品类(菜品id,菜品名,菜品类型,上架时间,单价,月销售,总数量) 管理员类(管理员id,账号,密码) 客户类(客户i ...
- 【wp】2021V&NCTF
前几天打完的V&NCTF公开赛,做题的时候没记过程,这是复现wp. 最后排名Top 18,三道RE+两道杂项(wp没啥可放的hhh)+一道web,感觉re题目还是挺好的,难度适中点赞,尤其pc ...
- Android学习之简易版的新闻应用
•准备工作 新建一个项目,命名为 FragmentBestProject,并选择 Empty Activity: 并将项目的模式结构改为 Project 模式: •进入主题 首先,准备好一个新闻实体类 ...
- springboot的yml中的bruid没有提示
解决方案: springboot的yml中的bruid没有提示只要在maven加上:druid-spring-boot-starter(注意版本的统一,否则可能会冲突) 效果图:
- 计算机体系结构——CH3存储系统
计算机体系结构--CH3存储系统 右键点击查看图像,查看清晰图像 X-mind 计算机体系结构--CH3存储系统 存储系统原理 主要性能 速度 容量 价格 两种存储系统 Cache与主存储器 虚拟存储 ...
- [Fundamental of Power Electronics]-PART I-6.变换器电路-6.2 变换器简单罗列
6.2 变换器简单罗列 变换器的数量可能有无穷种,因此将其全部列出是不可能的.这里给出了一个简单的罗列清单. 首先考虑含单个电感的单输入单输出变换器的类别.可以在电源和负载之间进行连接电感的方法数量是 ...
- mysql 批量操作,已存在则修改,不存在则insert,同时判断空选择性写入字段
注:如果是批量插入需要在 Java 连接数据库的字串中设置 &allowMultiQueries=true 针对单行数据有则修改无则新增 本案例的建表语句是: -- auto-generate ...