4.ElasticSearch系列之基本概念

1. 文档

ElasticSearch是面向文档的，文档是所有可搜索数据的最小单位
文档会被序列化成JSON格式，保存在ES中
每个文档都有一个unique ID

#查看前10条文档，了解文档格式

POST kibana_sample_data_ecommerce/_search

{

}

1.1 文档元数据

{

        "_index" : "kibana_sample_data_ecommerce", // 文档所属索引名

        "_type" : "_doc", // 文档所属的类型

        "_id" : "LY5Jc4IBJLxforJ4rVB5", // 文档唯一ID

        "_score" : 1.0, // 相关性打分

        "_source" : { // 文档的原始json数据

          ....

        }

}

2. 索引

索引是文档的容器，是一类文档的集合

#查看索引相关信息

GET kibana_sample_data_ecommerce

{

  "kibana_sample_data_ecommerce" : {

    "aliases" : { },

    // mapping定义文档的字段信息

    "mappings" : {

      "properties" : {

        "category" : {

          "type" : "text",

          "fields" : {

            "keyword" : {

              "type" : "keyword"

            }

          }

     },

     // settings索引配置信息

     "settings" : {

      "index" : {

        "routing" : {

          "allocation" : {

            "include" : {

              "_tier_preference" : "data_content"

            }

          }

        },

        "number_of_shards" : "1", // 分片数为1

        "auto_expand_replicas" : "0-1",

        "provided_name" : "kibana_sample_data_ecommerce",

        "creation_date" : "1659791584389",

        "number_of_replicas" : "0", // 副本数0

        "uuid" : "iH1-4-krQA6tda3W8Psmbw",

        "version" : {

          "created" : "7110299"

        }

      }

    }

  }

 }

}

以下为基本操作

// 查看索引的文档总数

GET kibana_sample_data_ecommerce/_count

// 查看indices

GET _cat/indices/kibana*?format=json

// 查看状态为绿的索引

GET _cat/indices?health=green&format=json

// 按照文档个数排序

GET /_cat/indices?s=docs.count:desc&format=json

// 查看具体的字段

GET /_cat/indices/kibana*?h=health,index,pri,rep,docs.count,mt&format=json

// 索引占用内存查看

GET /_cat/indices?v&h=i,tm&s=tm:desc

3.节点

节点是一个ElasticSearch的实例
每个节点都有一个名字，通过配置文件配置或启动时-E node.name=node1指定
每个节点启动后，会分配一个UID,保存在data目录下

3.1 Master-eligible Nodes和Master Nodes

每个节点启动后，默认就是一个Master-eligible节点,可以设置node.master=false禁止
Master-eligible节点可以参加主节点选举称为Master节点
每个节点保存了集群的状态，只有Master节点可以修改集群状态：
- 所有的节点信息
- 所有的索引及其相关的Mapping和Setting信息
- 分片的路由信息

3.2 Data Node和Coordinating Node

Data Node: 可以保存数据的节点，负责保存分片数据
Coordinating Node：负责接收client的请求，将请求分发到合适的节点，将结果进汇集，每个节点默认起到协调节点作用

4. 分片

主分片，用于解决数据水平扩展的问题。通过主分片，可以将数据分布到集群内的所有节点上
- 一个分片是一个运行的Lucene的实例
- 主分片数在创建索引时指定，后续不允许修改，除非reindex
副本，用于解决数据的高可用问题。副本分片是主分片的拷贝
- 副本分片数，可以动态调整
- 增加副本数，可以一定程度提高服务的可用性(读取的吞吐)

ES7.0开始，默认主分片设置为1，解决了over-sharding问题：

影响搜索结果的相关性打分，影响统计结果的准确性
单个节点分配过多分片，会导致资源浪费，同时也会影响性能

5. 集群相关查询示例

假设你启动了集群，如果没有多台机器，可以参考

win10下docker部署ES集群代码

# 查看集群节点信息

GET _cat/nodes?v

# 查看集群节点详细信息

GET /_nodes/es-node1,es-node2

# 查看节点指定字段信息

GET /_cat/nodes?v&h=id,ip,port,v,m

# 查看集群健康状态

GET _cluster/health

GET _cluster/health?level=shards

GET /_cluster/health/kibana_sample_data_ecommerce,kibana_sample_data_flights

GET /_cluster/health/kibana_sample_data_flights?level=shards

# 查看集群元数据等信息

GET /_cluster/state

#cluster get settings

GET /_cluster/settings

GET /_cluster/settings?include_defaults=true

# 查看分片情况

GET _cat/shards?v

GET _cat/shards?v&h=index,shard,prirep,state,unassigned.reason

欢迎关注公众号算法小生或沈健的技术博客

4.ElasticSearch系列之基本概念的更多相关文章

ElasticSearch 2 (28) - 信息聚合系列之高层概念
ElasticSearch 2 (28) - 信息聚合系列之高层概念摘要和查询表达式(query DSL)一样,聚合也有一种可编辑的语法:可以根据我们的需要混合以及匹配使用独立的功能单元.这也就是 ...
RxJava系列2(基本概念及使用介绍)
RxJava系列1(简介) RxJava系列2(基本概念及使用介绍) RxJava系列3(转换操作符) RxJava系列4(过滤操作符) RxJava系列5(组合操作符) RxJava系列6(从微观角 ...
【分布式搜索引擎】Elasticsearch中的基本概念
一.Elasticsearch中的基本概念以下概念基于这个例子:存储员工数据,每个文档代表一个员工 1)索引(index) 在Elasticsearch中存储数据的行为就叫做索引(indexing ...
ElasticSearch 2 (7) - 基本概念
ElasticSearch 2 (7) - 基本概念摘要 ElasticSearch的一些基本核心概念,理解这些概念有助于ElasticSearch的学习准实时NRT(Near Realtime) ...
第三百六十节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本概念
第三百六十节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本概念 elasticsearch的基本概念 1.集群:一个或者多个节点组织在一起 2.节点 ...
三十九 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本概念
elasticsearch的基本概念 1.集群:一个或者多个节点组织在一起 2.节点:一个节点是集群中的一个服务器,由一个名字来标识,默认是一个随机的漫微角色的名字 3.分片:将索引(相当于数据库)划 ...
Elasticsearch之重要核心概念（cluster（集群）、shards（分配）、replicas（索引副本）、recovery（据恢复或叫数据重新分布）、gateway（es索引的持久化存储方式）、discovery.zen（es的自动发现节点机制机制）、Transport（内部节点或集群与客户端的交互方式）、settings（修改索引库默认配置）和mappings）
Elasticsearch之重要核心概念如下: 1.cluster 代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的.es的一个概念就是 ...
net必问的面试题系列之基本概念和语法
上个月离职了,这几天整理了一些常见的面试题,整理成一个系列给大家分享一下,机会是给有准备的人,面试造火箭,工作拧螺丝,不慌,共勉. 1.net必问的面试题系列之基本概念和语法 2.net必问的面试题系 ...
Elasticsearch核心技术(2)--- 基本概念(Index、Type、Document、集群、节点、分片及副本、倒排索引)
Elasticsearch核心技术(2)--- 基本概念这篇博客讲到基本概念包括: Index.Type.Document.集群,节点,分片及副本,倒排索引. 一.Index.Type.Docume ...

随机推荐

将Nginx配置成系统开机启动服务
# 如何将nginx配置成我们的系统服务 # 1.在/usr/lib/systemd/system目录下面配置nginx.service内容 # 如果想要详细了解制作的过程:https://blog. ...
技术分享 | ARM下中标麒麟系统ky10使用Xtrabackup-8.0.25
欢迎来到 GreatSQL社区分享的MySQL技术文章,如有疑问或想学习的内容,可以在下方评论区留言,看到后会进行解答一.需求背景查询Percona官方手册,Xtrabackup 8.0可以备份M ...
MYSQL的Java操作器——JDBC
MYSQL的Java操作器--JDBC 在学习了Mysql之后,我们就要把Mysql和我们之前所学习的Java所结合起来而JDBC就是这样一种工具:帮助我们使用Java语言来操作Mysql数据库 J ...
C#/VB.NET 将PDF转为PDF/X-1a:2001
PDF/X-1a是一种PDF文件规范标准,在制作.使用PDF以及印刷时所需要遵循的技术条件,属于PDF/X-1标准下的一个子标准. PDF/X-1标准有由CGATS于1999年制定的PDF/X-1:1 ...
数据分表Mybatis Plus动态表名最优方案的探索
一.应用场景大家在使用Mybatis进行开发的时候,经常会遇到一种情况:按照月份month将数据放在不同的表里面,查询数据的时候需要跟不同的月份month去查询不同的表. 但是我们都知道,Mybat ...
Luogu5019 铺设道路（贪心）
水题,水得好无语 #include <iostream> #include <cstdio> #include <cstring> #include <alg ...
Java核心知识体系4：AOP原理和切面应用
1 概述我们所说的Aop(即面向切面编程),即面向接口,也面向方法,在基于IOC的基础上实现. Aop最大的特点是对指定的方法进行拦截并增强,这种增强的方式不需要业务代码进行调整,无需侵入到业务代码 ...
从HashMap的执行流程开始揭开HashMap底层实现
心得:如何学习源码: 从某个执行过程入手,建议先从整体入手,了解底层的数据结构是怎么一步一步优化的.最后,在了解完底层的数据结构优化过程后,从重要的核心方法入手,从它的执行流程入手,先去网上搜索了解它 ...
pytest精髓__fixture
命令:fixture(scope='function',params=None,autouse=False,ids=None,name=None) 参数说明 scope:有四个级别参数函数" ...
js函数( 普通函数、箭头函数 ) 内部this的指向
- 普通函数 | 具名普通函数.匿名普通函数,在不作为对象的属性值的情况下,其内部的 this 总是指向代码运行环境下的全局对象 ( 例如,浏览器中的 window ). 示例: (functio ...

4.ElasticSearch系列之基本概念

1. 文档

1.1 文档元数据

2. 索引

3.节点

3.1 Master-eligible Nodes和Master Nodes

3.2 Data Node和Coordinating Node

4. 分片

5. 集群相关查询示例

4.ElasticSearch系列之基本概念的更多相关文章

随机推荐

热门专题