文章转载自：https://mp.weixin.qq.com/s/alHHxXont6XFm_m9PfsGfw

1、什么是跨集群复制？

跨集群复制（Cross-cluster replication，简称：CCR）指的是：索引数据从一个 Elasticsearch 集群复制到另一个 Elasticsearch 集群。

对于主集群的索引数据的任何修改都会直接复制同步到从索引集群。

2、跨集群复制最早发布版本

Elasticsearch 6.7 版本。

3、跨集群复制的好处？

3.1 支持灾难恢复（DR）、确保高可用性（HA）

跨集群复制确保了不间断的服务可用性，能够承受住数据中心或区域服务中断的影响，降低了复杂性、节省了成本。

3.2 降低延迟

将数据复制到更靠近应用程序用户的集群可以最大限度地减少查询延迟。

3.3 水平可扩展性

跨多个副本集群拆分查询繁重的工作负载可提高应用程序可用性。

3.4 集中式汇报

企业客户可以将属于不同业务线的较小集群（数百个分支银行中心）中的报告不断汇总到一个中央集群（大型全球银行）中，以用于整合报告、方便可视化呈现。

PS：关于高可用，读者可能会有疑惑？

● 副本的目的是高可用，集群的快照和恢复和功能是高可用，怎么又来个跨集群复制呢？

副本主要体现在分片层面，可以看做分片的复制，一般集群至少设置一个副本，当主副本故障时，副本分片会提升为主分片。

● 快照和恢复主要体现在：集群级别和索引层面，可以全量或者增量。但，做不到实时备份和恢复。也就是说，快照会设定一个时间间隔，比如每 5 分钟备份一次。

当集群出现故障需要恢复时，极有可能会少备份最近 5 分钟的数据，

综上，才会有了跨集群复制的概念。

4、跨集群复制的核心概念

跨集群复制使用主动-被动模型（active-passive model）。

数据索引到一个领导者索引（leader index），并且数据被复制到一个或多个只读跟随者索引（read-only follower indices）。在向集群添加跟随者索引之前，必须配置包含领导者索引的远程集群。

leader-follower 模式在 kafka、zookeeper等中都有涉及，我认为翻译为：主、从模型比较契合。

核心释义解读如下：

active-passive model：主动-被动模型。
leader index：主索引或领导者索引。
read-only follower indices：从索引或跟随者索引。

5、跨集群复制的设计原则

5.1 高安全性

跨集群复制应该为所有数据流和 API 提供强大的安全控制。

5.2 准确性

跟随者索引和领导者索引的预期内容之间必须没有差异。

5.3 高性能

复制不应影响领导集群的索引率（数据写入速率）。

5.4 最终一致性

领导者和跟随者集群之间的复制延迟应该在几秒钟之内。

5.5 资源使用率低

复制应该使用最少的资源。

6、跨集群复制的实战一把

6.1 必备前置条件

6.1.1 前置条件1：激活License

CCR 是白金版付费功能，需要激活 30 天的 License，如果仅学习了解功能，建议先试用。

6.1.2 前置条件2：备好至少 2 个集群

跨集群复制，核心是“跨”和“复制”。

“跨”体现在至少得两个集群，否则没有意义。

最简单模型如图所示，我们用一台宿主机搭建两套集群环境，如下所示：

● 集群A：远端集群，remote cluster leader

Elasticsearch: 172.21.0.14:19203

kibana：172.21.0.14:5613

● 集群B：本地集群，local cluster follower

Elasticsearch: 172.21.0.14:19202

kibana：172.21.0.14:5612

6.1.3前置配置：开启软删除

7.0+之后版本已默认开启，无需单独配置。

早期版本，需参考官方文档进行静态配置，需要修改配置文件实现。

index.soft_deletes.enabled:true

跨集群复制的工作原理是：重放对 leader 索引分片执行的单个写入操作的历史记录。

Elasticsearch 需要在 leader 分片上保留这些操作的历史记录，以便它们可以被 follower 分片任务拉取。用于保留这些操作的底层机制是软删除。

6.1.4 前置配置：xpack 设置true

因为需要配置角色、权限等，Elasitcsearch 设置了xpack，就意味着 kibana 端需要设置账号、密码。

在 elasticsearch.yml 文件中添加如下配置。

xpack.security.enabled: true

通过：./elasticsearch-setup-passwords 命令行工具实现用户名和密码的设置。

auto 自动设置的结果参考如下：

./elasticsearch-setup-passwords auto

Changed password for user apm_system

PASSWORD apm_system = m5ob2a8OvoKuYpPPsiRd

Changed password for user kibana_system

PASSWORD kibana_system = xwdrhpVPSsbxxY1l0b50

Changed password for user kibana

PASSWORD kibana = xwdrhpVPSsbxxY1l0b50

Changed password for user logstash_system

PASSWORD logstash_system = 1zweZhAVEnqwh1flHBkz

Changed password for user beats_system

PASSWORD beats_system = 7Fo3bvmLISshjvHXTqAY

Changed password for user remote_monitoring_user

PASSWORD remote_monitoring_user = EvB4FkFs88gsCP073YGt

Changed password for user elastic

PASSWORD elastic = c7KmLqGTm6cyl2ABJPBY

否则会报错如下：

{

"error" : {

"root_cause" : [

{

"type" : "exception",

"reason" : "Security must be explicitly enabled when using a [trial] license. Enable security by setting [xpack.security.enabled] to [true] in the elasticsearch.yml file and restart the node."

}

],

"type" : "exception",

"reason" : "Security must be explicitly enabled when using a [trial] license. Enable security by setting [xpack.security.enabled] to [true] in the elasticsearch.yml file and restart the node."

},

"status" : 500

}

6.2 跨集群复制完整设置步骤

6.2.1 步骤1：从集群设置 remote cluster

在从集群上配置包含主索引的远程集群（remote cluster）

其实看到：remote cluster，第一时间要想到：跨集群检索（CCR）也需要配置它。

从集群配置主集群 leader，参考如下：

PUT /_cluster/settings

{

  "persistent": {

    "cluster": {

      "remote": {

        "leader": {

          "seeds": [

            "172.21.0.14:19303"

          ]

        }

      }

    }

  }

}

从集群监测一下remote配置是否成功。

GET /_remote/info

检测是否配置成功。

6.2.2 步骤2：配置权限

为跨集群复制配置权限。

跨集群复制用户在远程集群和本地集群上需要不同的集群和索引权限。

使用以下请求在本地和远程集群上创建单独的角色，然后创建具有所需角色的用户。

6.2.2.1 remote 集群配置权限

前置条件：设置 xpack 为 true，kibana 端配置账号和密码。

POST /_security/role/remote-replication

{

  "cluster": [

    "read_ccr"

  ],

  "indices": [

    {

      "names": [

        "kibana_sample_data_logs"

      ],

      "privileges": [

        "monitor",

        "read"

      ]

    }

  ]

}

6.2.2.2 local 集群配置权限

在本地集群上创建从索引。

POST /_security/role/remote-replication

{

  "cluster": [

    "manage_ccr"

  ],

  "indices": [

    {

      "names": [

        "kibana_sample_data_logs_follower"

      ],

      "privileges": [

        "monitor",

        "read",

        "write",

        "manage_follow_index"

      ]

    }

  ]

}

6.2.3 步骤3：创建自动跟踪模式以自动跟踪在远程集群中创建的索引

可以使用 Kibana 图形化界面配置或者命令行配置。

位置：Stack Management->Data->Cross-Cluster Replication。

步骤1：创建 follower index。

步骤2：配置 follower index。

需要设置如下：

Remote cluster，从集群对leader 的设置。
Leader index，主集群的索引。
Follower index，从集群的索引名称，与 Leader index 是一一对应的关系，是从 Leader 索引复制过来的数据。

执行成功后截图如下：

检查是否成功：

GET /kibana_sample_data_logs_from_leader/_ccr/stats

``

以上，跨集群同步设置成功之后，可以进一步做很多验证。

比如：主集群 leader 索引删除两条数据，从集群查看结果。对比发现，从集群也会跟着变化，这说明了跨集群复制已生效。

![](https://img2020.cnblogs.com/blog/794174/202111/794174-20211130091931200-1864078955.png)

![](https://img2020.cnblogs.com/blog/794174/202111/794174-20211130091939867-1070946584.png)

![](https://img2020.cnblogs.com/blog/794174/202111/794174-20211130091948609-123058129.png)

# 7、跨集群复制常用命令清单

包含但不限于：检查复制进度、暂停和恢复复制、重新创建跟随者索引和终止复制。

## 7.1 检查复制进度

GET /kibana_sample_data_logs_from_leader/_ccr/stats

![](https://img2020.cnblogs.com/blog/794174/202111/794174-20211130092013674-1235069471.png)

## 7.2 暂停和恢复复制

POST kibana_sample_data_logs_from_leader/_ccr/pause_follow

POST kibana_sample_data_logs_from_leader/_ccr/resume_follow

{

}



![](https://img2020.cnblogs.com/blog/794174/202111/794174-20211130092049357-169589597.png)

## 7.3 重新创建跟随者索引

分三步骤：

暂停

POST /follower_index/_ccr/pause_follow

关闭

POST /follower_index/_close?wait_for_active_shards=0

重建

PUT /follower_index/_ccr/follow?wait_for_active_shards=1

{

"remote_cluster" : "remote_cluster",

"leader_index" : "leader_index"

}



## 7.4 终止复制

需要先暂停、然后关闭，最后终止复制。

![](https://img2020.cnblogs.com/blog/794174/202111/794174-20211130092144361-2145061782.png)

POST kibana_sample_data_logs_from_leader/_ccr/unfollow



# 8、小结

实战出真知，由于这部分是收费功能，可能会用的少。这块一直是新知盲点，实战一把，才知道究竟！

针对data stream 数据流的处理，跨集群也是支持的，限于篇幅原因，本文没有展开，更多内容推荐阅读官方文档。

耗时12小时+，希望对你有帮助！

Elasticsearch 主从同步之跨集群复制的更多相关文章

redis主从同步故障切换及集群配置
一.redis是一中高性能的缓存数据库, 原理:1. 从服务器向主服务器发送 SYNC 命令.2. 接到 SYNC 命令的主服务器会调用BGSAVE 命令,创建一个 RDB 文件,并使用缓冲区记录接下 ...
Elasticsearch：跨集群复制 Cross-cluster replication（CCR)
Elasticsearch跨集群搜索(Cross Cluster Search)
1.简介 Elasticsearch在5.3版本中引入了Cross Cluster Search(CCS 跨集群搜索)功能,用来替换掉要被废弃的Tribe Node.类似Tribe Node,Cros ...
elasticsearch跨集群数据迁移
写这篇文章,主要是目前公司要把ES从2.4.1升级到最新版本7.8,不过现在是7.9了,官方的文档:https://www.elastic.co/guide/en/elasticsearch/refe ...
Elasticsearch：跨集群搜索 Cross-cluster search (CCS)
转载自:https://blog.csdn.net/UbuntuTouch/article/details/104588232 跨集群搜索(cross-cluster search)使您可以针对一个或 ...
关于redis的主从、哨兵、集群
关于redis主从.哨兵.集群的介绍网上很多,这里就不赘述了. 一.主从通过持久化功能,Redis保证了即使在服务器重启的情况下也不会损失(或少量损失)数据,因为持久化会把内存中数据保存到硬盘上,重 ...
关于redis主从｜哨兵｜集群模式
关于redis主从.哨兵.集群的介绍网上很多,这里就不赘述了. 一.主从通过持久化功能,Redis保证了即使在服务器重启的情况下也不会损失(或少量损失)数据,因为持久化会把内存中数据保存到硬盘上,重 ...
redis主从｜哨兵｜集群模式
关于redis主从.哨兵.集群的介绍网上很多,这里就不赘述了. 一.主从通过持久化功能,Redis保证了即使在服务器重启的情况下也不会损失(或少量损失)数据,因为持久化会把内存中数据保存到硬盘上,重 ...
ElasticSearch 深入理解三：集群部署设计
ElasticSearch 深入理解三:集群部署设计 ElasticSearch从名字中也可以知道,它的Elastic跟Search是同等重要的,甚至以Elastic为主要导向. Elastic即可 ...

随机推荐

jdk8 hashmap 链表resize 源码分析
重点看这部分代码 for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) { old ...
@RequestBody，@RequestParam是否能随意改变入参字母大小写
在工作中遇到了一个问题,很多接口有的入参是companyName,有的入参是companyname,实际上,这两入参能任意适配所有接口,甚至随意改变大小写! 1. @RequestBody是完全按照驼 ...
SVM简要介绍
SVM 支持向量机(SVM),是一个用于解决二分类问题的有监督机器学习模型. 1.SVM的两个优点更高的速度在有一定的样本数量支持下(成千上万张),具有比其他模型有更好的效果 2.SVM的工作过程 ...
阿里云搭建redis集群
1.安装redis # 下载redis包 wget http://download.redis.io/releases/redis-5.0.5.tar.gz tar -zxvf redis-5.0.5 ...
PaddleOCR系列（二）--hubserving & pdserving & hub install
一.各种部署方式特点及注意事项简称 hubserving=PaddleHub Serving pdserving=PaddleHub Serving hub install =指通过paddlehu ...
DeiT：注意力也能蒸馏
DeiT:注意力也能蒸馏 <Training data-efﬁcient image transformers & distillation through attention> ...
老子云携手福昕鲲鹏，首次实现3D OFD三维版式文档的重大突破
你见过能动起来的文档吗? 这可不是动图,也不是视频,而是可以直接自由交互3D模型的3D OFD文档! OFD可能有人不熟悉,它其实是国产"PDF",3D OFD则突破了以往文字.图 ...
ASP.NET Web 应用 Docker踩坑历程——续
ASP.NET Web 应用 Docker踩坑历程发表后,也开始使用Docker了,然而发布的过程比较痛苦,经常发生下图的事情: 据说是nuget包还原时发生错误百度了半天也找不到解决的方法,而发生 ...
springboot的@ConditionalOnClass注解
大家好,我是"良工说技术". 今天给大家带来的是springboot中的@ConditionalOnClass注解的用法.上次的@ConditionalOnBean注解还记得吗? ...
LuoguAT2827 LIS （LIS）
裸题 #include <iostream> #include <cstdio> #include <cstring> #include <algorithm ...

Elasticsearch 主从同步之跨集群复制