ElasticStack学习(三):ElasticSearch基本概念
1、文档
1)ElasticSearch是面向文档的,文档是所有可搜索数据的最小单位。例如:
a)日志文件中的日志项;
b)一张唱片的详细信息;
c)一篇文章中的具体内容;
2)在ElasticSearch中,文档会被序列化成Json格式:
a)Json对象是由字段组成的;
b)每个字段都有对应的字段类型(如:字符串、数值、日期类型等);
3)每个文档都有一个唯一的ID(Unique ID)
a)可以自己指定此ID;
b)也可以通过ElasticSearch自动生成;
4)我们可以将文档理解成关系型数据库中的一条数据记录,一条记录包含了一系列的字段。
5)Json文档的格式不需要预先定义
a)字段的类型可以指定或者由ElasticSearch自动推算;
b)Json支持数组、支持嵌套,如下图所示:

6)每一个文档中都包含有一份元数据,元数据的作用主要是用来标注文档的相关信息,如:
a)_index:文档所属的索引名;
b)_type:文档所属的类型名(从7.0开始,每一个索引只能创建一个Type:_doc,在此之前一个索引是可以设置多个Type的);
c)_id:文档的Unqie Id;
d)_source:文档的原始Json数据;
e)_version:文档的版本信息;
f)_score:文档的相关性算分;
2、索引(Index)
1)索引指的就是一类文档的集合,相当于文档的容器。
a)索引体现了逻辑空间的概念,每个索引都有自己的Mapping定义,用来定义所包含的文档的字段名和字段类型;
b)索引中的数据(文档)分散在Shard(分片)上,Shard体现了物理空间的概念;
2)索引的Mapping与Setting:
a)Mapping定义文档字段的类型;

b)Setting定义不同的数据分布;

3)索引的含义:
a)一般说“索引文档到ElasticSearch的索引中”,前面的索引指的是一个动词的含义,也就是保存一个文档到ElasticSearch中。后面的索引是指在ElasticSearch集群中,可以创建很多个不同的索引;
b)索引分为:B树索引和倒排索引,而倒排索引在ElasticSearch中是非常重要的;
3、ElasticSearch与RDBMS的代入理解与类比如下:
| RDBMS | ElasticSearch |
| Table | Index(Type) |
| Row | Document |
| Column | Field |
| Schema | Mapping |
| SQL | DSL(Domain Specific Language:领域专用语言) |
两者相对比,若对数据进行全文检索,以及进行算分时,ElasticSearch更加合适;当涉及的数据事务比较高时,那RDBMS更加合适。在实际生产中,一般是两者进行结合使用。
4、集群
ElasticSearch集群实际上是一个分布式系统,而分布式系统需要具备两个特性:
1)高可用性
a)服务可用性:允许有节点停止服务;
b)数据可用性:部分节点丢失,不会丢失数据;
2)可扩展性
随着请求量的不断提升,数据量的不断增长,系统可以将数据分布到其他节点,实现水平扩展;
ElasticSearch的集群通过不同的名字来进行区分,默认名字“elasticsearch”;
可以通过配置文件修改或者命令行修改:-E cluster.name=test
一个集群中可以有一个或者多个节点;
5、节点
1)节点是什么?
a)节点是一个ElasticSearch的实例,其本质就是一个Java进程;
b)一台机器上可以运行多个ElasticSearch实例,但是建议在生产环境中一台机器上只运行一个ElasticSearch实例;
2)每个节点都有名字,可以通过配置文件进行配置,也可以通过命令行进行指定,如:-E node.name=node1
3)每个节点在启动之后,会被分配一个UID,保存在data目录下;
4)Master-Eligible【有资格、胜任者】 Node与Master Node的说明:
a)每个节点启动之后,默认就是一个Master Eligible节点,当然可以在配置文件中将其禁止,node.master:false
b)Master-Eligible Node可以参加选主流程,成为Master Node;
c)当第一个节点启动时,它会将其选举为Master Node;
d)每个节点都保存了集群状态,但只有Master Node才能修改集群的状态,包括如下:
所有的节点信息;
所有的索引和其相关的Mapping与Setting信息;
分片的路由信息;
5)Data Node与Coordinating【协调、整合】 Node的说明:
a)Data Node:可以保存数据的节点,负责保存分片数据,在数据扩展上起到至关重要的作用;
b)Coordinating Node:它通过接受Rest Client的请求,会将请求分发到合适的节点,最终将结果汇集到一起,再返回给Client;
每个节点都默认起到Coordinating Node的职责;
6)Hot Node(热节点)与Warm Node(冷节点)的说明:
Hot Node:有更好配置的节点,其有更好的资源配置,如磁盘吞吐、CPU速度;
Warm Node:资源配置较低的节点;
7)Machine Learning Node:负责机器学习的节点,常用来做异常检测;
8)配置节点类型
每个节点在启动时,会读取elasticsearch.yml配置文件,来确定当前节点扮演什么角色。在生产环境中,应该将节点设置为单一的角色节点,这样可以有更好的性能,更清晰的职责,可以针对节点的不同给予不能的机器配置。

6、分片
1)Primary Shard(主分片)
可以解决数据水平扩展的问题,通过主分片,可以将数据分布到集群内的所有节点之上。
a)一个主分片是一个运行的Lucene的实例;
b)主分片数是在索引创建时指定,后续不允许修改,除非Reindex;
2)Replica Shard(副本)
可以解决数据高可用的问题,它是主分片的拷贝。
a)副本分片数可以动态调整;
b)增加副本数,在一定程度上可以提高服务的可用性;
3)分片的设定
对于生产环境中分片的设定,需要提前做好容量规划,因为主分片数是在索引创建时预先设定的,后续无法修改。
a)分片数设置过小
导致后续无法增加节点进行水平扩展。
导致分片的数据量太大,数据在重新分配时耗时;
b)分片数设置过大
影响搜索结果的相关性打分,影响统计结果的准确性;
单个节点上过多的分片,会导致资源浪费,同时也会影响性能;
7、ElasticSearch健康状况的查看

1)Green:主分片与副本都正常分配;
2)Yellow:主分片全部正常分配,有副本分片未能正常分配;
3)Red:有主分片未能分配;
8、总结
通过上面介绍,我们可以知道,索引与文档更偏向于开发人员的视角,属于逻辑上的一种概念;节点与分片更偏向于运维人员的视角,属于物理上的一种概念。
大家可关注我的公众号

知识学习来源:《Elasticsearch核心技术与实战》
ElasticStack学习(三):ElasticSearch基本概念的更多相关文章
- Elasticsearch学习之基本核心概念
在Elasticsearch中有许多术语和概念 1. 核心概念 Elasticsearch集群可以包含多个索引(indices)(数据库),每一个索引可以包含多个类型(types)(表),每一个类型包 ...
- ELK 学习笔记之 elasticsearch基本概念和CRUD
elasticsearch基本概念和CRUD: 基本概念: CRUD: 创建索引: curl -XPUT 'http://192.168.1.151:9200/library/' -d '{" ...
- [ZZ] 深度学习三巨头之一来清华演讲了,你只需要知道这7点
深度学习三巨头之一来清华演讲了,你只需要知道这7点 http://wemedia.ifeng.com/10939074/wemedia.shtml Yann LeCun还提到了一项FAIR开发的,用于 ...
- Android JNI学习(三)——Java与Native相互调用
本系列文章如下: Android JNI(一)——NDK与JNI基础 Android JNI学习(二)——实战JNI之“hello world” Android JNI学习(三)——Java与Nati ...
- SCARA——OpenGL入门学习三
OpenGL入门学习[三] 在第二课中,我们学习了如何绘制几何图形,但大家如果多写几个程序,就会发现其实还是有些郁闷之处.例如:点太小,难以看清楚:直线也太细,不舒服:或者想画虚线,但不知道方法只能用 ...
- 学习下ElasticSearch
ElasticSearch基础概念 Elasticsearch的Head插件安装 Elasticsearch在Centos 7上的安装常见的问题 使用场景:比如分库的情况下,你想统计所有数据的报表,就 ...
- Elasticsearch入门教程(二):Elasticsearch核心概念
原文:Elasticsearch入门教程(二):Elasticsearch核心概念 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:ht ...
- day 82 Vue学习三之vue组件
Vue学习三之vue组件 本节目录 一 什么是组件 二 v-model双向数据绑定 三 组件基础 四 父子组件传值 五 平行组件传值 六 xxx 七 xxx 八 xxx 一 什么是组件 首先给 ...
- Elasticsearch基本概念和使用
Elasticsearch基本概念和使用 1.操作索引 1.1.基本概念 Elasticsearch也是基于Lucene的全文检索库,本质也是存储数据,很多概念与MySQL类似的. 对比关系: 索引( ...
- Linux 系统编程 学习:00-有关概念
Linux 系统编程 学习:00-有关概念 背景 系统编程其实就是利用系统中被支持的调度API进行开发的一个过程. 从这一讲开始,我们来介绍有关Linux 系统编程的学习. 知识 在进行Linux系统 ...
随机推荐
- VC++ 编译libcurl 支持SSL,GZIP(有脚本)
由于网上下载的 libcurl 不支持 gzip,只好自己动手编译,期间走了很多弯路,下面是最终成功的记录. 我所使用的环境 Visual Studio 2010 . Windows 7 64 bit ...
- WPF中使用cefsharp
原文:WPF中使用cefsharp 新入职一家公司,由写服务端接口变成了软硬件通信.服务器.客户端.C/S.B/S乱七八糟各种打杂.首先接收一个WPF项目,因为不熟WPF,再加上前端我也不熟,我打算使 ...
- HDOJ 2189 悼念512四川汶川大地震遇难者——来生一起走 【生成函数】
意甲冠军:没有解释的很清楚. 策略:如果, 这是改变一个简单的生成函数. 这道题做了好久,才明确是那有毛病.还是理解的不够深刻. AC代码: #include<stdio.h> #incl ...
- POJ读书笔记2.1 —— 鸡兔笼带
http://blog.csdn.net/pipisorry/article/details/36433305 问题描写叙述 一个笼子里面关了鸡和兔子(鸡有2仅仅脚.兔子有4仅仅脚.没有例外). 已 ...
- 用callgraph生成的函数调用关系图
Wu Zhangjin 创作于 2015/04/05 评论打赏 By Falcon of TinyLab.org 2015/04/03 1 故事缘由 源码分析是程序员离不开的话题.无论是研究开源项目, ...
- WPF图片放大后模糊的解决方法
原文:WPF图片放大后模糊的解决方法 WPF中显示图片的方式很多,可以用Image控件来显示图像,或者直接设置一个控件的Background.图片的放大也很简单,直接设置显示图片的控件的Width和H ...
- glibc头文件和宏定义
头文件没啥好说的,无非就是" "和< >的区别,这估计只要是学过C/C++的人都明白.现在的编译器对头文件的包含顺序没有要求,但老的C实现则不一样.当然,我们现在无需关 ...
- 解决WPF的ScrollViewer在使用触摸屏时,滑到尽头窗口抖动的情况
原文:解决WPF的ScrollViewer在使用触摸屏时,滑到尽头窗口抖动的情况 wpf的ScrollViewer在触摸条件下 默认在尽头时会有一个窗口一起被拖动的FeedBack,但对用户的交互很不 ...
- C# Excel导入Access
/// <summary> /// 导入 /// </summary> private void btn_In_Click(object sender, EventArgs e ...
- 条款09:绝不在构造和析构过程中调用virtual函数
不该在构造函数和析构函数期间调用virtual函数,这一点是C++与jave/C#不同的地方之一. 假设有一个class继承体系,用来模拟股市交易如买进.卖出的订单等等.这样的交易一定要经过审计,所以 ...