Elasticsearch索引生命周期管理探索

文章转载自：

https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247484130&idx=1&sn=454f1994eb9434687f787f00533d414d&chksm=eaa82acadddfa3dcef7c1cf3966db4828f1e46f6302cececbf5a20ee353310800f39a1df367e&scene=21#wechat_redirect

冷热分离结合滚动模式工作流程如下：

    步骤1：有一个用于写入的索引别名，其指向活跃索引（热数据）； 

    步骤2：另外一个用于读取（搜索）的索引别名，指向不活跃索引（冷数据）；

    步骤3：活跃索引具有和热节点数量一样多的分片，可以充分发挥昂贵硬件的索引写入能力；

    步骤4：当活跃索引太满或者太老的时候，它就会滚动：新建一个索引并且索引别名自动从老索引切换到新索引；

    步骤5：移动老索引到冷节点上并且缩小为一个分片，之后可以强制合并和压缩。

0、引言

Elasticsearch上海Meetup中ebay工程师提了索引生命周期管理的概念。的确，在Demo级别的验证阶段我们数据量比较小，不太需要关注索引的生命周期，一个或几个索引基本就能满足需要。所以，这也会产生一种假象，认为：“Elasticsearch不就是增删改查，毛毛雨啦”的荒诞的假象。

但是，在实战开发的生产环境中，索引的动态模板设置、索引Mapping设置、索引分片数/副本数设置、索引创建、打开、关闭、删除的全生命周期的管理必须高度关注，做好提前知识储备，否则，会在开发后期出现由于数据激增暴露架构设计不合理问题，甚至引发分片/节点数据丢失、集群宕机等严重问题。

1、什么是Elasticsearch索引生命周期管理？

Elasticsearch索引生命周期管理指：Elasticsearch从设置、创建、打开、关闭、删除的全生命周期过程的管理。

Elasticsearch生产环境中一般采用多索引结合基于时间、基于空间的横向扩展的方式存储数据，随着数据量的增多，不用修改索引的底层架构逻辑。

2、索引生命周期管理为什么重要？

索引管理决定Elasticsearch鲁棒性、高可用性。

索引管理和搜索、插入性能也密切相关。

实际场景例子：100节点的集群中某一个节点数据丢失后，GET /_cat/nodes?v 接口的返回时延时延非常大，接近5-8s。搜索、聚合的性能更不必说。

原因：节点丢失后，ES会自动复制分片到新的节点中去，但是该丢失节点的shard非常大（几百个GB甚至上TB），集群当时的写入压力也非常大。这么大量级的数据拷贝和实时写入，最终导致延时会非常大。

3、索引生命周期管理面临的挑战

1）索引管理需要ES专业知识和业务知识的结合。

业务数据多少结合业务场景，有突发情况。

2）涉及生产环境的操作。

3）用户使用有突发情况。

比如：参数设置错误，分片数和副本数弄反了，路由设置错误。

4）索引操作的时候可能会失败。

5）高可用性挑战。

4、高可用的索引管理初探

Ebay的分享提及内部团队开发了索引管理系统，会择期分享，截止20180805 github还没有开源，期待中。

索引生命周期管理的核心就是定义索引的早期阶段，前面考虑充分了，后面的架构才会高效、稳定。

实际Elasticsearch5.X之后的版本已经推出：新增了一个Rollover API。Rollover API解决的是以日期作为索引名称的索引大小不均衡的问题。

medcl介绍如下：Rollover API对于日志类的数据非常有用，一般我们按天来对索引进行分割（数据量更大还能进一步拆分），没有Rollover之前，需要在程序里设置一个自动生成索引的模板，

相比于模板，Rollover API是更为简洁的方式。

4.1 RollOver 的定义

当现有索引被认为太大或太旧时，滚动索引API将别名滚动到新索引。该API接受一个别名和一个条件列表。别名必须只指向一个索引。如果索引满足指定条件，则创建一个新索引，并将别名切换到指向新索引的位置。

6.XRollover支持的三种条件是：

    索引存储的最长时间。如： "max_age": "7d",

    索引支持的最大文档数。如："max_docs": 1000,

    索引最大磁盘空间大小。"max_size": "5gb"。

注意：

5.X版本不支持"max_size": "5gb"磁盘大小的方式。

分片的大小并不是一个可靠的测量标准，因为正在进行中的合并会产生大量的临时分片大小增长，而当合并结束后这些增长会消失掉。五个主分片，每个都在合并到一个 5GB 分片的过程中，那么此时索引大小会临时增多 25GB！而对于文档数量来说，它的增长则是可以预测的。

4.2 RollOver的适用场景

这个特性对于存放日志数据的场景、索引非常大、索引实时导入数据的场景是极为友好的。

你也可以先在索引模板里面设置索引的setting、mapping等参数, 然后设定好_rollover 规则，剩下的es会自动帮你处理。

4.3 6.XRollOverAPI调用方式如下

方式一：基于序号的索引管理。

步骤1：创建索引（注意序号）

1PUT /logs-000001

2{

3 "aliases": {

4 "logs_write": {}

5 }

6}

步骤2：指定RollOver规则。

1POST /logs_write/_rollover

2{

3 "conditions": {

4 "max_age": "7d",

5 "max_docs": 2,

6 "max_size": "5gb"

7 }

8}

步骤3：批量插入数据。

1POST logs_write/log/_bulk

2{ "create": {"_id":1}}

3{ "text": "111"}

4{ "create": {"_id":2}}

5{ "text": "222" }

6{ "create": {"_id":3}}

7{ "text": "333"}

8{ "create": {"_id":4}}

9{ "text": "4444"}

注意啦，理论上：_id=3和_id=4的数据会滚动到logs-000002的索引，实际并没有。

这个问题困扰我一上午。实践验证发现，然并卵。

步骤4：重复步骤2。

查看返回结果如下：

1{

2 "old_index": "logs-000001",

3 "new_index": "logs-000002",

4 "rolled_over": true,

5 "dry_run": false,

6 "acknowledged": true,

7 "shards_acknowledged": true,

8 "conditions": {

9 "[max_docs: 2]": true,

10 "[max_age: 7d]": false,

11 "[max_size: 5gb]": false

12 }

13}

这样以后，后续插入的数据索引就自动变为logs-000002，logs-000003…..logs-00000N。

注意：

1）执行数据插入前要先执行_rollover API。

2）_rollover API不是一劳永逸的，需要手动执行后才能生效。

方式二：基于时间的索引管理。

步骤1：创建基于日期的索引。

1#PUT /<logs-{now/d}-1> with URI encoding:

2PUT /%3Clogs-%7Bnow%2Fd%7D-1%3E

3{

4 "aliases": {

5 "logs_write": {}

6 }

7}

URI 编码工具：http://t.cn/RAEZiuq

输入：<logs-{now/d}-1>

输出：%3Clogs-%7Bnow%2Fd%7D-1%3E

步骤2：插入一条数据。

1PUT logs_write/_doc/1

2{

3 "message": "a dummy log"

4}

步骤3：指定RollOver规则。

1POST /logs_write/_rollover

2{

3 "conditions": {

4 "max_docs": "1"

5 }

6}

返回结果：

1{

2 "old_index": "logs-2018.08.05-1",

3 "new_index": "logs-2018.08.05-000002",

4 "rolled_over": true,

5 "dry_run": false,

6 "acknowledged": true,

7 "shards_acknowledged": true,

8 "conditions": {

9 "[max_docs: 1]": true

10 }

11}

注意，可能感觉到日期没有变更困惑的问题解释如下：

1）如果立即执行，new_index的名字就是当前的日期：logs-2018.08.05-000002。

2）如果24小时候后执行，new_index的名字就是+1天后的日期：logs-2018.08.06-000002。

5、高可用的索引管理进阶

ES官网博客做了更好的诠释：http://t.cn/RDZUBKZ

翻译版本：http://t.cn/REFMMZM

在基础RollOver滚动索引的基础上，引入冷、热数据分离。这是实际业务非常需要一种场景。

冷热分离结合滚动模式工作流程如下：

步骤1：有一个用于写入的索引别名，其指向活跃索引（热数据）； 

步骤2：另外一个用于读取（搜索）的索引别名，指向不活跃索引（冷数据）；

步骤3：活跃索引具有和热节点数量一样多的分片，可以充分发挥昂贵硬件的索引写入能力；

步骤4：当活跃索引太满或者太老的时候，它就会滚动：新建一个索引并且索引别名自动从老索引切换到新索引；

步骤5：移动老索引到冷节点上并且缩小为一个分片，之后可以强制合并和压缩。

具体实现，官方博客已经做了具体的说明。

注意：

1"routing.allocation.include.box_type": "hot",

2"routing.allocation.total_shards_per_node": 2

单节点执行上述操作会导致失败，具体原因待进一步验证。

6、Rollover的不足和改进

Rollover API大大简化了基于时间的索引的管理。但是，仍然需要以一种重复的方式调用_rollover API接口，可以手动调用，也可以通过基于crontab的工具(如director)调用。

但是，如果翻转过程是隐式的并在内部进行管理，则会简单得多。其思想是在创建索引时(或在索引模板中相等地)在别名中指定滚动条件。

1PUT /<logs-{now/d}-1>

2{

3 "mappings": {...},

4 "aliases" : {

5 "logs-search" : {},

6 "logs-write" : {

7 "rollover" : {

8 "conditions": {

9 "max_age": "1d",

10 "max_docs": 100000

11 }

12 }

13 }

14 }

15}

github提出的改进建议如下：http://t.cn/RDZ45xt

截止：20180805这种方式没有实现。

7、小结

Elasticsearch索引生命周期管理是件大事，无论你是开发还是运维人员，千万不要轻视。

Rollover的出现能相对缓解分片、索引、集群的压力，相对高效的管理索引的生命周期。

结合curator的定时删除机制会更高效。

Elasticsearch索引生命周期管理探索的更多相关文章

Elasticsearch索引生命周期管理方案
一.前言在 Elasticsearch 的日常中,有很多如存储系统日志.行为数据等方面的应用场景,这些场景的特点是数据量非常大,并且随着时间的增长索引的数量也会持续增长,然而这些场景基本上只有 ...
ElasticSearch——索引生命周期管理
从ES6.6开始,Elasticsearch提供索引生命周期管理功能,索引生命周期管理可以通过API或者kibana界面配置,详情参考[index-lifecycle-management] 本文仅通 ...
Elasticsearch 索引生命周期管理 ILM 实战指南
文章转载自:https://mp.weixin.qq.com/s/7VQd5sKt_PH56PFnCrUOHQ 1.什么是索引生命周期在基于日志.指标.实时时间序列的大型系统中,集群的索引也具备类似 ...
Elasticsearch7.X ILM索引生命周期管理（冷热分离）
Elasticsearch7.X ILM索引生命周期管理(冷热分离) 一.“索引生命周期管理”概述 Elasticsearch索引生命周期管理指:Elasticsearch从设置.创建.打开.关闭.删 ...
Logstash & 索引生命周期管理（ILM）
Grok语法 Grok是通过模式匹配的方式来识别日志中的数据,可以把Grok插件简单理解为升级版本的正则表达式.它拥有更多的模式,默认,Logstash拥有120个模式.如果这些模式不满足我们解析日志 ...
Elastic 使用索引生命周期管理实现热温冷架构
Elastic: 使用索引生命周期管理实现热温冷架构索引生命周期管理 (ILM) 是在 Elasticsearch 6.6(公测版)首次引入并在 6.7 版正式推出的一项功能.ILM 是 Elast ...
这么简单的ES索引生命周期管理，不了解一下吗～
对于日志或指标(metric)类时序性强的ES索引,因为数据量大,并且写入和查询大多都是近期时间内的数据.我们可以采用hot-warm-cold架构将索引数据切分成hot/warm/cold的索引.h ...
Elasticsearch 快照生命周期管理 (SLM) 实战指南
文章转载自:https://mp.weixin.qq.com/s/PSfgPJc4dKN2pOZd0Y02wA 1.Elasticsearch 保证高可用性的方式 Elasticsearch 保证集群 ...
ES 7.13版本设置索引模板和索引生命周期管理
第一步:索引管理中查看都有哪些索引文件,然后添加索引模式(后面的日期用*表示) 第二步:索引生命周期管理自带的有一个log,就使用这个,不用再新建了,根据需求修改里面的配置就行了第三步:添加索引模 ...

随机推荐

记一次requests请求乱码的问题
太懒了,直接说原因吧: 请求返回的内容含有emoji表情我的解决办法是替换掉emoji字符: 安装库:pip install emoji 替换:emoji.demojize(CONTENT) 注意, ...
Python3.7+Tornado5.1.1+Celery3.1+Rabbitmq3.7.16实现异步队列任务
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_99 在之前的一篇文章中提到了用Django+Celery+Redis实现了异步任务队列,只不过消息中间件使用了redis,redi ...
CentOS Docker安装 && docker 基础指令
1 # 直接从官网下载docker的安装命令包(docker已经很贴心将安装shell脚本帮我们准备好了) 2 curl -fsSL get.docker.com -o get-docker.sh 3 ...
附加进程到远程服务器中Docker容器内调试
很多时候,我们在本地开发过程中程序运行很正常,但是发布到线上之后由于环境的原因,可能会有一些异常.通常我们会通过日志来分析问题,除了日志还有一种常用的调试手段就是:附加进程. VS中的附加进程非常强大 ...
在Docker中部署GreatSQL并构建MGR集群
GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. 为了方面社区用户体验GreatSQL,我们同时还提供Docker镜像,本文详细介绍如何在Docker中部署GreatSQL ...
Apache DolphinScheduler 1.3.9 发布，新增 StandaloneServer
点击上方蓝字关注我们 2021 年 10 月 22 日,Apache DolphinScheduler 正式发布 1.3.9 版本.时隔一个半月,在社区贡献者的共同努力下,Apache Dolphi ...
解读Gartner2022年组装式应用报告：从组装式企业到组装式应用
摘要:"到2023年,采用组装式方法的组织在新特性交付速度比竞争对手快80%."Gartner 为什么未来的企业是组装式的? 物竞天择,适者生存,企业也是一样,在发展过程中,会为了 ...
java-分支结构（四种基本分支结构的认识）
分支结构:有条件的执行某语句,并非每句必走 1)if结构:1条路 2)if...else结构:2条路 3)if...else if结构:多条路 4)switch...case结构:多条路优点:效率高 ...
入门 Socket.io
概念 Socket.io 是一个支持客户端和服务器之间的低延迟.双向和基于事件的通信的库,除了支持 JavaScript 以外,还支持 Java.Python.Golang. Socket.io 构建 ...
virtio_net 设备的队列数问题
virtio_net设备的其他问题:见 https://www.cnblogs.com/10087622blog/p/15886345.html 一个virtio_net设备在 virtnet_pro ...

Elasticsearch索引生命周期管理探索

Elasticsearch索引生命周期管理探索的更多相关文章

随机推荐

热门专题