elasticsearch系列（一）术语

ulysses_you 2024-10-13 23:05:15 原文

elasticsearch（以下简称es）是一款开源的搜索引擎，基于apach lucene。最近在做nlp的时候顺便研究一下。

下面是官方列举的术语解释

Near Realtime

接近实时的查询，通常情况下，延迟在1s以内

Cluster

一个集群由1个或者多个节点组成，这些节点提供整个数据和索引，性能来源于每个节点。一个集群有一个唯一的名字，默认为“elasticsearch”，

Node

一个node启动的时候分配一个唯一的id（UUID），自动会加入名为“elasticsearch”的cluster，前提是网络没有问题，一个node只能加入一个集群。

Index

一个index是一些有相似特征的documents集合，比如有一个顾客类的index，一个生产类的index，有一个订单类的index。index必须都是小写的

Type

一个index可以定义出多个type，一个type是一个逻辑的类别或者分区，并且其语义完全取决于自己，一般而言一个type定义了包含多个fields的documents。

Document

一个document是可以被索引信息的基础单元，尽管一个document在物理上是属于index的，但事实上，一个document必须被索引或者分配到一个index里的type。

Shard&Replicas

一个index可以存储大量的数据，并且超过单节点的限制。例如，单个index可能含有几十亿个documents，占据了1TB的磁盘空间，这就可能导致单个node可能没有这么大的空间，或者在查询的时候会很慢。

为了解决这个问题，es给出了shard的概念，将一个index拆分成多个部分。创建的index就可以申明shard的数量，每个shard都是拥有完整和独立的index。

Sharding的两个重要点：

1.shard允许你对大量数据做横向切分

2.shard允许通过多个shards分布式并发的操作，从而提升性能和吞吐量

Shard是如何分布的以及多个它们的documents是如何被合并都由es管理，这些对使用者都是透明的。

关于容错，es通过replica来解决，replica是index下的shard的副本。

Replicaing的两个重要点：

1.提供了HA。需要提醒的是，replica和shard不应该在同一个node

2.搜索可以在所有的replica并发处理

你可以在创建的时候设置index的shard和replica数量，但是之后，你只能更改replica的数量，而不能更改shard的数量.

Es的默认配置为，5个shards和1个replica，如果你的cluster有两个及以上的node，则一共有10个shards（5 primary shards,5 replica shards）

其他

Es的一个shard就是lucene的index

总结

逻辑上，index、type、documents作为namespace的存在，可以充分表现Restful风格的接口

物理上，index可以看做是数据库中的库，通过shard（类似partition）做HA和高并发

参考资料

//es官方介绍

https://www.elastic.co/guide/en/elasticsearch/reference/5.2/_basic_concepts.html

elasticsearch系列（一）术语的更多相关文章

elasticsearch系列（三）分表分库
首先ES没有库和表的概念,只有index,type,document(详细术语可以看ES的系列一 http://www.cnblogs.com/ulysses-you/p/6736926.html), ...
elasticsearch系列（五）score
概述 score在ES中有着很重要的作用,有了它才有了rank,是验证文档相关性的关键数据,score越大代表匹配到的文档相关性越大官方解释查询的时候可以用explain来展示score的计算过程 ...
Elasticsearch系列（1）：认识Elasticsearch
官方定义 Elasticsearch 是一个实时的分布式搜索分析引擎, 它能让你以一个之前从未有过的速度和规模,去探索你的数据. 它被用作全文检索.结构化搜索.分析以及这三个功能的组合. Elasti ...
Elasticsearch 系列文章汇总(持续更新...)
系列文章列表 Query DSL Query DSL 概要,MatchAllQuery,全文查询简述 Match Query Match Phrase Query 和 Match Phrase Pre ...
Elasticsearch系列(五)----JAVA客户端之TransportClient操作详解
Elasticsearch JAVA操作有三种客户端: 1.TransportClient 2.JestClient 3.RestClient 还有种是2.3中有的NodeClient,在5.5.1中 ...
elasticsearch系列（三）库表理解
首先ES没有库和表的概念,只有index,type,document(详细术语可以看ES的系列一 http://www.cnblogs.com/ulysses-you/p/6736926.html), ...
elasticsearch系列（四）部署
本文采用tar包的方式部署es 准备jdk8的环境 5.4.0的es依赖jdk8及以上版本下载linux版的jdk jdk-8u121-linux-x64.tar.gz tar -zvxf jdk- ...
elasticsearch系列一：elasticsearch（ES简介、安装&配置、集成Ikanalyzer）
一.ES简介 1. ES是什么? Elasticsearch 是一个开源的搜索引擎,建立在全文搜索引擎库 Apache Lucene 基础之上用 Java 编写的,它的内部使用 Lucene 做索引 ...
elasticsearch系列八：ES 集群管理（集群规划、集群搭建、集群管理）
一.集群规划搭建一个集群我们需要考虑如下几个问题: 1. 我们需要多大规模的集群? 2. 集群中的节点角色如何分配? 3. 如何避免脑裂问题? 4. 索引应该设置多少个分片? 5. 分片应该设置几个 ...

随机推荐

w7如何安装配置多个tomcat
最近工作比较闲,所以我就开始做自己的项目.公司的的项目用的是tomcat7 为了和公司的项目区分开,我打算再配置一个tomcat.问题也就随之而至.经过整理之后,我整理出了一个完整的流程.保证可以在w ...
大数据系列之Flume--几种不同的Sources
1.flume概念 flume是分布式的,可靠的,高可用的,用于对不同来源的大量的日志数据进行有效收集.聚集和移动,并以集中式的数据存储的系统. flume目前是apache的一个顶级项目. flum ...
Asp.net MVC 视图使用像Ajax，ViewBag提示为找到上下文
不知是什么原因,所有的视图中Ajax,ViewBag之类的都提示为找到上下文(由于换了个版本Vs,猜测应该是Vs的原因),然后顺利在网上找到了解决方案. 给地址链接:https://social.ms ...
内嵌Tomcat的Connector对象的静态代码块
在排查问题的过程中发现Connector对象有一个静态代码块: static { replacements.put("acceptCount", "backlog&quo ...
有关rip路由协议相关知识以及实例配置【第1部分】
有关rip路由协议相关知识以及实例配置[第一部分] RIP呢,这是一个比较重要的知识点,所以它的知识覆盖面很广泛:但是呢,我将会对碰到的问题进行一些分析解刨(主要是为了帮助自己理清思维):也希望能够从 ...
用递归的方式处理数组 && 把递归方法方法定义到数组的原型上（这是一次脑洞大开的神奇尝试）
在 javascript 里,如果我们想用一个函数处理数组 (Array) 中的每个元素,那我们有很多种选择,最简单的当然就是用自带的 forEach 函数(低版本也可以使用 lodash 中的 fo ...
SQL AlawaysOn 之二：添加组织和域用户
1.在管理工具打开Active Directory 用户和计算机 2.在域控制器名称下面右键选择新建--组织单位, 3.输入组织名定,点确定 4.在组织右键--新建--用户 5.输入用户信息,点 ...
Linux下python开发环境的准备
升级python 安装依赖: yum install lrzsz zlib zlib-devel openssl readline-deve gcc ibffi-devel python-dev ...
python的try方法中的else和finally的区别
#coding=utf-8__author__ = '14356_000'try: print '1'except: print '2'else: print '3'finally: print '4 ...
妈妈再也不用担心我的移动端了：网易和淘宝的rem方案剖析
从博主学习前端一路过来的经历了解到,前端移动开发是大部分从PC端转战移动端的小伙伴都非常头疼的一个问题,这边博主就根据一篇自己看过的移动开发文章来剖析一下网易和淘宝的rem解决方案,希望能够帮助到一些 ...