让Elasticsearch集群冷热分离、读写分离【转】

转自：https://blog.csdn.net/jiao_fuyou/article/details/50511255

根据Elasticsearch中文社区《ES冷热分离(读写分离) hot, stale 场景》一篇整理的。

一、冷热分离

按《控制Elasticsearch分片和副本的分配》来设置，将hot,stale数据分到不同的集群上去
hot集群只保留最近一天或两天数据
写一个定时任务每天凌晨将前一天的索引标记为stale
```
PUT /index_name/_settings

{

   "index.routing.allocation.include.zone" : "stale"

}
```
- 1
- 2
- 3
- 4
这样旧索引数据会自动迁移到stale集群上
详细情况参考：
https://www.elastic.co/guide/en/elasticsearch/reference/2.1/modules-cluster.html
https://www.elastic.co/guide/en/elasticsearch/reference/2.1/cluster-reroute.html

二、读写分离

即使这样处理后，hot集群即使只有一两数据，但是一般象log类数据，查询的一般都是最近一两天的数据，致使hot集群负载依然很大。es有没有办法实现像mysql主从的效果，然后查询只在从机上查询？有没有办法让副本分布在某些特定节点上，然后查询只查询这些节点？
按《elasticsearch高级配置之分片分布规则设置》中（强制分布规则）来设置，迫使不允许副本被分配到与主分片相同的区域，比如：让副本数据分布到stale集群上。

上面的规则有时并不能完全的控制复本一定在某个集群上，它只能尽量保证主分片和副本不在一个集群上，这个时候同样也可以起个定时任务，手动的将副本reroute到集群节点上

POST /_cluster/reroute

{

    "commands" : [ {

        "move" :

            {

              "index" : "test", "shard" : 0,

              "from_node" : "node1", "to_node" : "node2"

            }

        },

        {

          "allocate" : {

              "index" : "test", "shard" : 1, "node" : "node3"

          }

        }

    ]

}

详细情况参考：
https://www.elastic.co/guide/en/elasticsearch/reference/2.1/modules-cluster.html
https://www.elastic.co/guide/en/elasticsearch/reference/2.1/cluster-reroute.html

三、查询选项

上面两种方法将冷热，读写数据都分布到了不同的集群上，下面看看如何在指定查询参数，只查询stale集群节点上的数据。

POST /_search?preference=_only_nodes:zone:stale

{

    "query": {

        "match": {

            "title": "elasticsearch"

        }

    }

}

上面这个可以只查询node.zone: stale节点数据。这个查询选项要求ES版本在1.7.0以上。关于查询选项详细资料参考：

https://www.elastic.co/guide/en/elasticsearch/reference/1.7/search-request-preference.html?q=preference

四、总结

已经不再indexing的索引，通过require.zone的方式迁移到stale集群上，完成冷热分离；
还在indexing的索引，通过reroute将replica shard强制allocate到stale集群上；
search的时候，通过?preference=_replica或者?preference=_only_nodes:xxx的方式指定读取哪些。
但是需要注意一点的是：因为es的replica也是一个实际需要cpu和io的indexing过程，而且indexing本身也有要求要写够一定副本数来才算写入完成。所以，你即使只请求replica，也是有可能影响到写入的。

所以，你只能开启一个副本——写入副本数要求是从二个副本开始才有。

让Elasticsearch集群冷热分离、读写分离【转】的更多相关文章

linux上使用amoeba实现MySql集群，以及读写分离，主从复制
一.由于是MySql集群,所以就不可能只有一个MySql,需要多个MySql,具体安装步骤,可以参考http://www.cnblogs.com/ywzq/p/4882140.html这个地址进行安装 ...
基于Keepalived高可用集群的MariaDB读写分离机制实现
一 MariaDB读写分离机制在实现读写分离机制之前先理解一下三种主从复制方式:1.异步复制:MariaDB默认的复制即是异步的,主库在执行完客户端提交的事务后会立即将结果返给给客户端,并不关心从库 ...
剖析Elasticsearch集群系列第一篇 Elasticsearch的存储模型和读写操作
剖析Elasticsearch集群系列涵盖了当今最流行的分布式搜索引擎Elasticsearch的底层架构和原型实例. 本文是这个系列的第一篇,在本文中,我们将讨论的Elasticsearch的底层存 ...
剖析Elasticsearch集群系列之一：Elasticsearch的存储模型和读写操作
转载:http://www.infoq.com/cn/articles/analysis-of-elasticsearch-cluster-part01 1.辨析Elasticsearch的索引与Lu ...
PB 级大规模 Elasticsearch 集群运维与调优实践
PB 级大规模 Elasticsearch 集群运维与调优实践 https://mp.weixin.qq.com/s/PDyHT9IuRij20JBgbPTjFA | 导语腾讯云 Elasticse ...
EFK教程(4) - ElasticSearch集群TLS加密通讯
基于TLS实现ElasticSearch集群加密通讯作者:"发颠的小狼",欢迎转载目录 ▪ 用途 ▪ ES节点信息 ▪ Step1. 关闭服务 ▪ Step2. 创建CA证书 ...
数据源管理 | 搜索引擎框架，ElasticSearch集群模式
本文源码:GitHub·点这里 || GitEE·点这里一.集群环境搭建 1.环境概览 ES版本6.3.2,集群名称esmaster,虚拟机centos7. 服务群角色划分说明 en-maste ...
Elasticsearch 集群和索引健康状态及常见错误说明
之前在IDC机房线上环境部署了一套ELK日志集中分析系统, 这里简单总结下ELK中Elasticsearch健康状态相关问题, Elasticsearch的索引状态和集群状态传达着不同的意思. 一. ...
Elasticsearch学习总结 (Centos7下Elasticsearch集群部署记录)
一. ElasticSearch简单介绍 ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.Elasticse ...

随机推荐

涂鸦之作WanAndroid第三方APP
Wan Android App Introduction 我的涂鸦之作,正如名字一样这个一个WanAndroid 的第三方Android客户端,采用MVP架构+Kotlin语言+一大堆轮子.现在的代 ...
SpringBoot启动banner更改
这篇文章的开始先给大家看一个图片用过或者看过springboot的人都知道,这就是springboot启动的banner,这一篇介绍如何自定义springboot的启动bannner. 先介绍一个可 ...
2018-6-20-随笔-SQL Server中乱码
SQL Server中乱码解决方案: 在Sql Server2005英文版中,如果未对Varchar类型的字段进行设置,那么很多朋友会发现向数据库中插入记录时,如果对应的varchar类型字段的值为 ...
[CC-ADJLEAF2]Adjacent Leaves
[CC-ADJLEAF2]Adjacent Leaves 题目大意: 给定一棵有根树,考虑从根开始进行DFS,将所有叶子按照被遍历到的顺序排列得到一个序列. 定义一个叶子集合合法,当且仅当存在一种DF ...
[CQOI2005]三角形面积并
[CQOI2005]三角形面积并题目大意: 求$n(n\le100)$个三角形的面积并. 思路: 自适应辛普森法,玄学卡精度可过. 源代码: #include<cmath> #inc ...
HDU5293 : Tree chain problem
问题即:选择价值和最多的链,使得每个点最多被一条链覆盖. 那么考虑其对偶问题:选择最少的点(每个点可以重复选),使得每条链上选了至少$w_i$个点. 那么将链按照LCA的深度从大到小排序,每次若发现点 ...
PAT基础6-12
6-12 判断奇偶性 (10 分) 本题要求实现判断给定整数奇偶性的函数. 函数接口定义: int even( int n ); 其中n是用户传入的整型参数.当n为偶数时,函数返回1:n为奇数时返回0 ...
Selenium上传文件方法总结
Web上本地上传图片,弹出的框Selenium是无法识别的,也就是说,selenium本身没有直接的方法去实现上传本地文件,这里总结了两种上传文件的方式. 一.利用Robot类处理文件上传. 其大致流 ...
plsql 工具怎样导出 oracle 表数据
一.双击 plsql 工具,输入登陆用户.登陆密码以及登陆数据库名称,如下图: 二.菜单 Tools --> Export Tables...,如下图: 三.进入导出界面后,可以选择单个表,进行 ...
GMA Round 1 大吉大利，晚上吃鸡
传送门大吉大利,晚上吃鸡新年走亲访友能干点啥呢,咱开黑吃鸡吧. 这里有32个人,每个人都可能想玩或者不想玩,这样子一共有$2^{32}$种可能.而要开黑当然得4人4人组一队(四人模式),所以说如果 ...