4.ElasticSearch系列之基本概念

1. 文档

ElasticSearch是面向文档的，文档是所有可搜索数据的最小单位
文档会被序列化成JSON格式，保存在ES中
每个文档都有一个unique ID

#查看前10条文档，了解文档格式

POST kibana_sample_data_ecommerce/_search

{

}

1.1 文档元数据

{

        "_index" : "kibana_sample_data_ecommerce", // 文档所属索引名

        "_type" : "_doc", // 文档所属的类型

        "_id" : "LY5Jc4IBJLxforJ4rVB5", // 文档唯一ID

        "_score" : 1.0, // 相关性打分

        "_source" : { // 文档的原始json数据

          ....

        }

}

2. 索引

索引是文档的容器，是一类文档的集合

#查看索引相关信息

GET kibana_sample_data_ecommerce

{

  "kibana_sample_data_ecommerce" : {

    "aliases" : { },

    // mapping定义文档的字段信息

    "mappings" : {

      "properties" : {

        "category" : {

          "type" : "text",

          "fields" : {

            "keyword" : {

              "type" : "keyword"

            }

          }

     },

     // settings索引配置信息

     "settings" : {

      "index" : {

        "routing" : {

          "allocation" : {

            "include" : {

              "_tier_preference" : "data_content"

            }

          }

        },

        "number_of_shards" : "1", // 分片数为1

        "auto_expand_replicas" : "0-1",

        "provided_name" : "kibana_sample_data_ecommerce",

        "creation_date" : "1659791584389",

        "number_of_replicas" : "0", // 副本数0

        "uuid" : "iH1-4-krQA6tda3W8Psmbw",

        "version" : {

          "created" : "7110299"

        }

      }

    }

  }

 }

}

以下为基本操作

// 查看索引的文档总数

GET kibana_sample_data_ecommerce/_count

// 查看indices

GET _cat/indices/kibana*?format=json

// 查看状态为绿的索引

GET _cat/indices?health=green&format=json

// 按照文档个数排序

GET /_cat/indices?s=docs.count:desc&format=json

// 查看具体的字段

GET /_cat/indices/kibana*?h=health,index,pri,rep,docs.count,mt&format=json

// 索引占用内存查看

GET /_cat/indices?v&h=i,tm&s=tm:desc

3.节点

节点是一个ElasticSearch的实例
每个节点都有一个名字，通过配置文件配置或启动时-E node.name=node1指定
每个节点启动后，会分配一个UID,保存在data目录下

3.1 Master-eligible Nodes和Master Nodes

每个节点启动后，默认就是一个Master-eligible节点,可以设置node.master=false禁止
Master-eligible节点可以参加主节点选举称为Master节点
每个节点保存了集群的状态，只有Master节点可以修改集群状态：
- 所有的节点信息
- 所有的索引及其相关的Mapping和Setting信息
- 分片的路由信息

3.2 Data Node和Coordinating Node

Data Node: 可以保存数据的节点，负责保存分片数据
Coordinating Node：负责接收client的请求，将请求分发到合适的节点，将结果进汇集，每个节点默认起到协调节点作用

4. 分片

主分片，用于解决数据水平扩展的问题。通过主分片，可以将数据分布到集群内的所有节点上
- 一个分片是一个运行的Lucene的实例
- 主分片数在创建索引时指定，后续不允许修改，除非reindex
副本，用于解决数据的高可用问题。副本分片是主分片的拷贝
- 副本分片数，可以动态调整
- 增加副本数，可以一定程度提高服务的可用性(读取的吞吐)

ES7.0开始，默认主分片设置为1，解决了over-sharding问题：

影响搜索结果的相关性打分，影响统计结果的准确性
单个节点分配过多分片，会导致资源浪费，同时也会影响性能

5. 集群相关查询示例

假设你启动了集群，如果没有多台机器，可以参考

win10下docker部署ES集群代码

# 查看集群节点信息

GET _cat/nodes?v

# 查看集群节点详细信息

GET /_nodes/es-node1,es-node2

# 查看节点指定字段信息

GET /_cat/nodes?v&h=id,ip,port,v,m

# 查看集群健康状态

GET _cluster/health

GET _cluster/health?level=shards

GET /_cluster/health/kibana_sample_data_ecommerce,kibana_sample_data_flights

GET /_cluster/health/kibana_sample_data_flights?level=shards

# 查看集群元数据等信息

GET /_cluster/state

#cluster get settings

GET /_cluster/settings

GET /_cluster/settings?include_defaults=true

# 查看分片情况

GET _cat/shards?v

GET _cat/shards?v&h=index,shard,prirep,state,unassigned.reason

欢迎关注公众号算法小生或沈健的技术博客

4.ElasticSearch系列之基本概念的更多相关文章

ElasticSearch 2 (28) - 信息聚合系列之高层概念
ElasticSearch 2 (28) - 信息聚合系列之高层概念摘要和查询表达式(query DSL)一样,聚合也有一种可编辑的语法:可以根据我们的需要混合以及匹配使用独立的功能单元.这也就是 ...
RxJava系列2(基本概念及使用介绍)
RxJava系列1(简介) RxJava系列2(基本概念及使用介绍) RxJava系列3(转换操作符) RxJava系列4(过滤操作符) RxJava系列5(组合操作符) RxJava系列6(从微观角 ...
【分布式搜索引擎】Elasticsearch中的基本概念
一.Elasticsearch中的基本概念以下概念基于这个例子:存储员工数据,每个文档代表一个员工 1)索引(index) 在Elasticsearch中存储数据的行为就叫做索引(indexing ...
ElasticSearch 2 (7) - 基本概念
ElasticSearch 2 (7) - 基本概念摘要 ElasticSearch的一些基本核心概念,理解这些概念有助于ElasticSearch的学习准实时NRT(Near Realtime) ...
第三百六十节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本概念
第三百六十节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本概念 elasticsearch的基本概念 1.集群:一个或者多个节点组织在一起 2.节点 ...
三十九 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本概念
elasticsearch的基本概念 1.集群:一个或者多个节点组织在一起 2.节点:一个节点是集群中的一个服务器,由一个名字来标识,默认是一个随机的漫微角色的名字 3.分片:将索引(相当于数据库)划 ...
Elasticsearch之重要核心概念（cluster（集群）、shards（分配）、replicas（索引副本）、recovery（据恢复或叫数据重新分布）、gateway（es索引的持久化存储方式）、discovery.zen（es的自动发现节点机制机制）、Transport（内部节点或集群与客户端的交互方式）、settings（修改索引库默认配置）和mappings）
Elasticsearch之重要核心概念如下: 1.cluster 代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的.es的一个概念就是 ...
net必问的面试题系列之基本概念和语法
上个月离职了,这几天整理了一些常见的面试题,整理成一个系列给大家分享一下,机会是给有准备的人,面试造火箭,工作拧螺丝,不慌,共勉. 1.net必问的面试题系列之基本概念和语法 2.net必问的面试题系 ...
Elasticsearch核心技术(2)--- 基本概念(Index、Type、Document、集群、节点、分片及副本、倒排索引)
Elasticsearch核心技术(2)--- 基本概念这篇博客讲到基本概念包括: Index.Type.Document.集群,节点,分片及副本,倒排索引. 一.Index.Type.Docume ...

随机推荐

vue的一些问题
如有不正,请指正! 目录 1.组件化 2.注册组件 a.创建组件构造器 b.注册组件: c.使用组件 3.组件不能访问vue实例上的数据 4.全局组件与局部组件 5.v-model语法糖组件通信 6 ...
devops-2：Jenkins的使用及Pipeline语法讲解
DevOps-Jenkins Jenkins简介 Jenkins是一个开源软件项目,是基于Java开发的一种持续集成工具,用于监控持续重复的工作,旨在提供一个开放易用的软件平台,使软件项目可以进行持续 ...
Blazor和Vue对比学习（进阶2.2.4）：状态管理之持久化保存（2），Cookie/Session/jwt
注:本节涉及到前后端,这个系列的对比学习,还是专注在前端Vue和Blazor技术,所以就不撸码了,下面主要学习概念. 我们知道,Http是无状态协议,客户端请求服务端,认证一次后,如果再次请求,又要重 ...
6.6 NOI 模拟
\(T1\)括号序列 --那是,朝思夜想也未尝得到的自由一个比较常见的转化,考虑如何判断前一段和后一段能够拼成一个合法的括号序列充要条件: 前半部分,'('看为\(1\), ')'看为\(-1\) ...
一颗完整意义的LPWAN SOC无线通信芯片——ASR6601
ASR6601是完整意义的LPWAN SOC无线通信芯片,该芯片集成了LORA射频收发器.调制解调器和32位RISC MCU.MCU采用cortex M4,频率48mhz.LORA射频收发器从150 ...
软件装在D盘，实测有效
C盘容量小,希望把所有软件都装到D盘,试过很多次,没什么作用.今天装MS全家桶的时候看到了个帖子,实测有效,Visio.Word.Excel.PowerPoint都装到了D盘原贴链接为:http:/ ...
Redis 12 持久化
参考源 https://www.bilibili.com/video/BV1S54y1R7SB?spm_id_from=333.999.0.0 版本本文章基于 Redis 6.2.6 概述 Redi ...
MyBatis 03 缓存
简介什么是缓存存在内存中的临时数据. 将用户经常查询的数据放在缓存(内存)中,用户去查询数据就不用从磁盘上(关系型数据库数据文件)查询,转从缓存中查询,从而提高查询效率,解决了高并发系统的性能问题 ...
java-分支重载以及构造方法
1:方法的签名: 方法名+参数列表就是一个方法的签名 2.方法的重载(Overload): 1)发生在同一个类中,方法名称相同,参数列表不同 2)编译器在编译时会根据方法的签名自动绑定方法 3.构造方 ...
D8调试工具——jsvu的使用细则
d8 is V8's own developer shell. D8 是一个非常有用的调试工具,你可以把它看成是 debug for V8 的缩写.我们可以使用 d8 来查看 V8 在执行 JavaS ...

4.ElasticSearch系列之基本概念

1. 文档

1.1 文档元数据

2. 索引

3.节点

3.1 Master-eligible Nodes和Master Nodes

3.2 Data Node和Coordinating Node

4. 分片

5. 集群相关查询示例

4.ElasticSearch系列之基本概念的更多相关文章

随机推荐

热门专题