【ElasticSearch】文档路由的原理

ElasticSearch集群环境下新增文档如何确认该文档被分配到哪个分片中？

路由算法：

　　⾸先这肯定不会是随机的，否则将来要获取⽂档的时候我们就不知道从何处寻找了。实际上，这个过程是根据下⾯这个公式决定的：

　　shard = hash(routing) % number_of_primary_shards

　　routing 是⼀个可变值，默认是⽂档的 _id ，也可以设置成⼀个⾃定义的值。 routing通过 hash 函数⽣成⼀个数字，然后这个数字再除以 number_of_primary_shards （主分

⽚的数量）后得到余数。这个分布在 0 到 number_of_primary_shards-1 之间的余数，就是我们所寻求的⽂档所在分⽚的位置。

　　这就解释了为什么我们要在创建索引的时候就确定好主分⽚的数量并且永远不会改变这个数量：

　　因为如果数量变化了，那么所有之前路由的值都会⽆效，⽂档也再也找不到了。

　　新增⼀个⽂档(指定id)

PUT /nba/_doc/1

{

 "name": "哈登",

 "team_name": "⽕箭",

 "position": "得分后卫",

 "play_year": "10",

 "jerse_no": "13"

}

　　查看⽂档在哪个分⽚上

GET /nba/_search_shards?routing=1

{

 "nodes" : {

 "V1JO7QXLSX-yeVI82WkgtA" : {

 "name" : "node-1",

 "ephemeral_id" : "_d96PgOSTnKo6nrJVqIYpw",

 "transport_address" : "192.168.1.101:9300",

 "attributes" : {

 "ml.machine_memory" : "8589934592",

 "xpack.installed" : "true",

 "ml.max_open_jobs" : "20"

 }

 },

 "z65Hwe_RR_efA4yj3n8sHQ" : {

 "name" : "node-3",

 "ephemeral_id" : "MOE_Ne7ZRyaKRHFSWJZWpA",

 "transport_address" : "192.168.1.101:9500",

 "attributes" : {

 "ml.machine_memory" : "8589934592",

 "ml.max_open_jobs" : "20",

 "xpack.installed" : "true"

 }

 }

 },

 "indices" : {

 "nba" : { }

 },

 "shards" : [

 [

 {

 "state" : "STARTED",

 "primary" : true,

 "node" : "V1JO7QXLSX-yeVI82WkgtA",

 "relocating_node" : null,

 "shard" : 2,

 "index" : "nba",

 "allocation_id" : {

 "id" : "leX_k6McShyMoM1eNQJXOA"

 }

 },

 {

 "state" : "STARTED",

 "primary" : false,

 "node" : "z65Hwe_RR_efA4yj3n8sHQ",

 "relocating_node" : null,

 "shard" : 2,

 "index" : "nba",

 "allocation_id" : {

 "id" : "6sUSANMuSGKLgcIpBa4yYg"

 }

 }

 ]

 ]

}

【ElasticSearch】文档路由的原理的更多相关文章

ElasticSearch文档操作介绍三
ElasticSearch文档的操作文档存储位置的计算公式: shard = hash(routing) % number_of_primary_shards 上面公式中,routing 是一个可变 ...
Elasticsearch入门教程(四)：Elasticsearch文档CURD
原文:Elasticsearch入门教程(四):Elasticsearch文档CURD 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接: ...
elasticsearch 文档
elasticsearch 文档文档格式索引中最基本的单元叫做文档 document. 在es中文档的示例如下: { "_index": "questions&quo ...
elasticsearch文档-analysis
elasticsearch文档-analysis analysis 基本概念全文搜索引擎会用某种算法对要建索引的文档进行分析, 从文档中提取出若干Token(词元), 这些算法称为Tokeniz ...
elasticsearch文档-modules
elasticsearch文档-modules modules 模块 cluster 原文基本概念 cluster: 集群,一个集群通常由很多节点(node)组成 node: 节点,比如集群中的每台 ...
Elasticsearch文档查询
简单数据集到目前为止,已经了解了基本知识,现在我们尝试用更逼真的数据集,这儿已经准备好了一份虚构的JSON,关于客户银行账户信息的.每个文档的结构如下: { , , "firstname& ...
ElasticSearch文档及分布式文档存储
1.什么是文档? 文档由索引(_index),类型(_type),唯一标识(_id) 组成,我们为 _index(索引) 分配相关逻辑地址分片,该索引下的数据会根据索引以及类型计算哈希来分配数据存储的 ...
elasticsearch 文档阅读笔记(三)
文档 elasticsearch是通过document的形式存储数据的,个人理解文档就是一条数据一个对象我们添加索引文档中不仅包含了数据还包含了元数据比如我们为一个数据添加索引文档中不仅有jso ...
elasticsearch文档-字段的mapping
mapping == Mapping是指定义如何将document映射到搜索引擎的过程,比如一个字段是否可以查询以及如何分词等,一个索引可以存储含有不同"mapping types" ...

随机推荐

《C++ Primer》笔记第8章 IO库
iostream定义了用于读写流的基本类型,fstream定义了读写命名文件的类型,sstream定义了读写内存string对象的类型. 标准库使我们能忽略这些不同类型的流之间的差异,这是通过继承机制 ...
jmeter数据库链接配置
通常使用数据库有3个要求,性能好.数据一致性有保障.数据安全可靠:数据库优化的前提也是这三个要求.有句玩笑话叫少做少犯错,不做不犯错.DB优化的思路就是少做,减少请求次数,减少数据传输量,减少运算量. ...
monkey稳定性测试的步骤及策略
1.adb的作用是什么?adb的全称:android debug bridge 安卓调试桥梁,包含在 Android SDK 平台工具软件包中.通过该命令与设备进行通信,以便进行调试adb可以同时管理 ...
nginx错误分析 `104: Connection reset by peer`
故障描述应用从虚拟机环境迁移到kubernetes环境中,有些应用不定时出现请求失败的情况,且应用没有记录任何日志,而在NGINX中记录502错误.我们查看了之前虚拟机中的访问情况,没有发现该问题. ...
剑指 Offer 64. 求1+2+…+n + 递归
剑指 Offer 64. 求1+2+-+n Offer_64 题目描述题解分析使用&&逻辑短路规则来终止循环 package com.walegarrett.offer; /** ...
Chrome OS超便捷安装指南
Chrome OS是一款Google开发的基于PC的操作系统. Google Chrome OS是一款基于Linux的开源操作系统.Google在自己的官方博客表示,初期,这一操作系统将定位于上网本. ...
腾讯云发布存储一体机TStor，打通全面上云“最后一公里”
随着云计算.大数据.人工智能等技术的发展,各行各业加速数据化转型,数据容量以前所未有的速度增长,本地存储难以适应数据的指数式增长. 另一方面,公有云因其易扩展.低成本.安全稳定的特点,逐渐被企业广泛应 ...
Web实验报告
攻防世界 reverse re4-unvm-me
re4-unvm-me alexctf-2017 pyc文件,祭出大杀器EasyPythonDecompiler.exe 得到源代码: 1 # Embedded file name: unvm_me. ...
《Selenium自动化测试实战:基于Python》之 Selenium IDE插件的安装与使用
第3章 Selenium IDE插件的安装与使用京东:https://item.jd.com/13123910.html 当当:http://product.dangdang.com/292045 ...

【ElasticSearch】文档路由的原理

【ElasticSearch】文档路由的原理的更多相关文章

随机推荐

热门专题