ElasticSearch概述

官网：https://www.elastic.co/

The Elastic Stack, 包括 Elasticsearch、Kibana、Beats 和 Logstash（也称为 ELK Stack），能够安全可靠地获取任何来源、任何格式的数据，然后实时地对数据进行搜索、分析和可视化。ES是一个开源的高扩展的分布式全文搜索引擎，是ELK Stack的核心。它可以近乎实时的存储、检索数据；本身扩展性很好，可以扩展到上百台服务器，处理PB级别的数据。

ElasticSearch入门

安装

安装过程参考：https://www.cnblogs.com/bingmous/p/15643678.html

基本操作

一般情况下，当然也可以使用POST新增

GET表示获取
PUT表示新增
POST表示修改
DELETE表示删除

查看es相关信息

GET _cat/nodes     # 查看所有节点

GET _cat/health    # 查看es健康状况

GET _cat/master    # 查看主节点

GET _cat/indices   # 查看所有索引

GET _cat/indices?v # 带参数v, 更详细,显示title

GET _cluster/health # 查看集群健康信息

索引操作

PUT customer # 创建索引 使用PUT

DELETE customer # 删除索引 使用DELETE

GET customer # 查看单个索引 使用GET

文档操作

# 添加一个文档：

# 使用PUT添加，不指定id会报错，因为添加认为你准确知道添加哪个id的数据。

# 使用POST添加，可以不指定id，会自动生成，因此相同数据会认为是多条数据，因为id不同

# 重复发送会增加版本号，并覆盖原文档

PUT /customer/_doc/1

{

  "name":"john"

}

# 使用_create添加文档

# 准确表示在创建文档，只能创建一次，PUT POST都可以，多次创建会失败

PUT /customer/_create/1

{

  "name":"john"

}

## 总结：_create用于创建，只能创建一次，PUT、POST都可以。_doc表示文档，PUT必须指定id才能添加，POST会随机生成id。如果索引没有会自动创建

# 删除一个文档

DELETE customer/_doc/5

# 查看一个文档

GET customer/_doc/6

# 结果如下，带_的都是元信息

{

  "_index" : "customer",    # 在哪个索引

  "_type" : "_doc",         # 在哪个类型

  "_id" : "6",              # id

  "_version" : 1,           # 版本号

  "_seq_no" : 27,           # 序列号,用于并发控制，每次更新就会加1，用来做乐观锁

  "_primary_term" : 1,      # 同上，主分片重新分配，如重启就会变化

  "found" : true,

  "_source" : {             # 实际存储的数据

    "name" : "john"

  }

}

# 使用乐观锁修改文档，更新时携带?if_seq_no=0&if_primary_term=1 当满足条件时修改数据，否则不修改

PUT /customer/_doc/6?if_seq_no=27&if_primary_term=1 # PUT POST + _doc是覆盖，修改使用POST + _update

{

  "name2":"alice"

}

# 更新一个文档

# 对比原数据，没有变化则不更新，noop，如果使用_doc直接创建新文档，会直接覆盖

# _update只允许使用POST，"doc"表示文档，是内置字段，原数据会增加age字段

POST customer/_update/6/

{

  "doc":{

    "age":18

  }

}

# 可以直接添加一个新文档，直接覆盖，根据实际情况确定

# 总结：大并发偶尔更新的使用_update更新，重新计算分配规则，大并发更新较多的直接覆盖

bulk批量API

# 语法格式

PUT customer/_bulk 或 PUT _bulk 或使用POST，POST _bulk表示对整个es操作

{action:{metadata}}		# action可以是index delete create update 这个请求体是操作

{requestbody}		# 这个是数据

# 示例1

PUT customer/_bulk	# POST也可以 index表示都是创建新文档 多次发送覆盖

{"index":{"_id":"1"}}

{"age":123}

# 示例2

PUT customer/_bulk

{"index":{"_id":"1"}}

{"name":"John Doe"}

{"index":{"_id":"2"}}

{"name":"Jane"}

# 复杂示例，对整个ES操作，删除索引、创建索引

PUT _bulk

{"delete":{"_index":"webset","_type":"blog","_id":"123"}}

{"create":{"_index":"webset","_type":"blog","_id":"123"}}

{"title":"My first blog post"}

{"index":{"_index":"webset","_type":"blog"}}

{"title":"My second blog post"}

{"update":{"_index":"webset","_type":"blog","_id":"123"}}

{"doc":{"title":"My updateed blok post"}}

官方数据批量导入，用于练习

https://github.com/elastic/elasticsearch/blob/7.4/docs/src/test/resources/accounts.json

PUT bank/acount/_bulk，注意：acount作为类型已经被弃用了

进阶检索

Search API

es支持的两种基本方式：
- 通过REST request URI 发送搜索参数（URI + 请求参数）
- 通过REST request body 来发送（URI + 请求体）

# 通过request uri检索 q=* 等价于query match_all

GET bank/_search?q=*&sort=account_number:desc

# 通过request body检索，请求体为Query DSL

GET bank/_search

{

  "query": {

    "match_all": {}

  },

  "sort": [

    {

      "account_number": {    # 也可以简写为"account_number": "desc"

        "order": "desc"

      }

    }

  ]

}

# 默认返回10条数据，在hits.hits数组里，_source里是存储的数据

Query DSL

基本语法

# ES提供的可以查询的json风格的DSL(Domain Specific language 领域特定语言)，称为Query DSL.该查询语言非常全面，并且刚开始的时候有些复杂，真正学好它的方法是从一些基础示例开始的。

# 典型结构

{

    query_name:{    # 根操作，要做什么，对于某个字段也是同样的结构

        argument:value,

        argument:value,...

    }

}

基本使用

GET bank/_search

query # 定义如何查询

    match_all       # 代表查询所有 等价于xxx/_search?q=*

    match           # 【模糊匹配】分词匹配，全文检索按照评分进行排序，keyword表示匹配字段整个内容，全文检索使用match，非text使用term，text类型才有keyword子属性

    term            # 【精确匹配】比如整数值，文本字段使用match，文本字段进行了分析，使用term检索非常困难

    match_phrase    # 【短语匹配】不进行分词，对整个短语进行匹配

    multi_match     # 【多个字段匹配】在某些字段里面匹配

    bool     # 【复合查询】，可以组合多个查询

        must     # 【必须满足】这几个查询都可以使用range指定范围lte,gte,lt,gt，贡献相关性得分

        must_not # 【必须不满足】

        should   # 【应该满足】

        filter   # 【过滤】不贡献相关性得分

sort    # 【排序】，会在前字段相等时，后字段内部排序，跟数组

from    # 【从第几条开始】偏移量

size    # 【限定返回结果数量】完成分页，默认返回10，设置为0不显示数据

_source # 【返回部分字段】指定返回哪些字段

aggs    # 【对匹配结果聚合】

    terms    # 【字段频次】size指定频次结果的前几个

    avg      # 【字段平均值】

Mapping

字段类型，7.x之后移除了type的概念：

两个不同type下的两个相同字段在ES同一个索引下是同一个field，必须在两个不同的type下定义相同的filed映射，否则不同type中的相同字段名称处理就会出现冲突的情况，导致lucene处理效率下降，去掉type就是为了提高ES处理数据的效率。

# 查看某个索引的映射

GET bank/_mapping

# 创建映射 keyword表示不进行分词，text会进行分词,index默认为true表示是否可被检索

# 可以在创建索引的时候添加映射

PUT my_index

{

  "mappings": {

    "properties": {

      "age":{"type": "integer"},

      "email":{"type": "keyword"},

      "name":{"type": "text","index": true}

    }

  }

}

# 对现有索引再添加映射

PUT my_index/_mapping

{

  "properties":{

    "employee_id": {

      "type":"long",

      "index":"false"

    }

  }

}

# 不能更改映射，只能将数据迁移至新索引

POST _reindex

{

  "source": {

    "index": "my_index"

  },

  "dest": {

    "index": "my_new_index"

  }

}

分词

安装ik，下载：https://github.com/medcl/elasticsearch-analysis-ik

# 直接解压在elasticsearch的plugins目录

# 查看

bin/elasticsearch-plugin.bat list

测试ik

# 分词 无法分割中文

POST _analyze

{

  "analyzer": "standard",

  "text": ["hello你好"]

}

# 使用ik分词器,观察两个效果

POST _analyze

{

  "analyzer": "ik_smart",

  "text": ["我是中国人"]

}

POST _analyze

{

  "analyzer": "ik_max_word",

  "text": ["我是中国人"]

}

自定以词库，通过ngix搭建自定义词库，nginx安装见附录

配置词库，在ik安装目录下的config/IKAnalyzer.cfg.xml，返回自定义词汇即可

Rest-Client

api参考官方文档：https://www.elastic.co/guide/en/elasticsearch/client/index.html
导入依赖

  <dependency>

            <groupId>org.elasticsearch.client</groupId>

            <artifactId>elasticsearch-rest-high-level-client</artifactId>

            <version>7.8.0</version>

  </dependency>

待整理

安装nginx

待整理

ElasticSearch学习笔记（详细）的更多相关文章

ElasticSearch学习笔记（超详细）
文章目录初识ElasticSearch 什么是ElasticSearch ElasticSearch特点 ElasticSearch用途 ElasticSearch底层实现 ElasticSearc ...
Elasticsearch学习笔记一
Elasticsearch Elasticsearch(以下简称ES)是一款Java语言开发的基于Lucene的高效全文搜索引擎.它提供了一个分布式多用户能力的基于RESTful web接口的全文搜索 ...
elasticsearch学习笔记——相关插件和使用场景
logstash-input-jdbc学习 ES(elasticsearch缩写)的一大优点就是开源,插件众多.所以扩展起来非常的方便,这也造成了它的生态系统越来越强大.这种开源分享的思想真是与天朝格 ...
java多线程学习笔记——详细
一.线程类 1.新建状态(New):新创建了一个线程对象. 2.就绪状态(Runnable):线程对象创建后,其他线程调用了该对象的start()方法.该状态的线程位于可运行线程池中, ...
Elasticsearch学习笔记
Why Elasticsearch? 由于需要提升项目的搜索质量,最近研究了一下Elasticsearch,一款非常优秀的分布式搜索程序.最开始的一些笔记放到github,这里只是归纳总结一下. 首先 ...
【原】无脑操作：ElasticSearch学习笔记（01）
开篇来自于经典的“保安的哲学三问”(你是谁,在哪儿,要干嘛) 问题一.ElasticSearch是什么?有什么用处? 答:截至2018年12月28日,从ElasticSearch官网(https:// ...
ElasticSearch学习笔记-01 简介、安装、配置与核心概念
一.简介 ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进 ...
Elasticsearch学习笔记一
本文版权归博客园和作者吴双本人共同所有转载和爬虫请注明原文地址 www.cnblogs.com/tdws. 本文参考和学习资料 <ES权威指南> 一.基本概念存储数据到ES中的行为叫做 ...
elasticsearch 学习笔记
基本概念集群和节点的概念1.集群是由节点组成的2.每个集群都有唯一的名字默认是elasticsearch3.cluster.name: niubiwali //集群的名字很重要因为每个节点只是集群的 ...

随机推荐

python组合
目录一:组合基础使用二:组合一:组合基础使用组合: 就是一个对象拥有一个属性,该属性的值是另一个对象继承:满足什么是什么的关系,is-a的关系继承是一把双刃剑,单继承能实现就尽量少的继承, ...
这个命令行HTTP客户端工具真不错
程序员专属微信红包封面1000个,兑换码:dWK7fUs2WQG cURL相信很多做开发的.运维的都不陌生,是非常有用的一个终端请求工具,借助于它可以在命令行中进行HTTP.FTP等请求,在Linux ...
微服务架构 | 5.1 使用 Netflix Hystrix 断路器
目录前言 1. Hystrix 基础知识 1.1 Hystrix 断路器强调调用 1.2 两大类别的 Hystrix 实现 1.3 舱壁策略 1.4 Hystrix 在远程资源调用失败时的决策过程 ...
plsql 视图中为什么使用替代触发器
/* 什么是视图? 视图:数据库对象,存的是一个查询命令:当作一个虚拟的数据表来使用: 应用场景: 简化查询操作:不能直接在视图上进行create,insert,update操作: 创建视图? 需要管 ...
PHP 取整
转载请注明来源:https://www.cnblogs.com/hookjc/ 对于功能强大的PHP语言来说,能掌握到它的函数用法,一般都能灵活的编写各种需求的PHP程序.我们经常用到的PHP取整函数 ...
Java&Tomcat环境变量配置
版本匹配: Java PATH环境变量.作用是指定命令搜索路径,在shell下面执行命令时,它会到PATH变量所指定的路径中查找看是否能找到相应的命令程序.我们需要把 jdk安装目录下的bin目录增加 ...
js Array.prototype.slice.call(arguments,0) 理解
Array.prototype.slice.call(arguments,0) 经常会看到这段代码用来处理函数的参数网上很多复制粘帖说:Array.prototype.slice.call(argu ...
Java线程--ReentrantLock使用
原创:转载需注明原创地址 https://www.cnblogs.com/fanerwei222/p/11871593.html Java线程--ReentrantLock使用, 互斥锁: Reent ...
【BZOJ2654】tree(生成树二分)
题目链接大意给你一个无向带权连通图,每条边是黑色或白色,求一棵最小权的恰好有\(Need\)条白色边的生成树. 题目保证有解,输出最小权值. 其中每条边权在\([1,100]\)范围内. 思路首 ...
【web安全】Nodejs原型链污染分析
Nodejs原型链污染分析什么是js原型? 可以将js原型理解为其他OOP语言中的类,但还是有细微区别. 1. function F(){...} 2. var f = new F(); 分析: 1 ...

ElasticSearch学习笔记（详细）