Kafka集群扩展以及重新分布分区

我们往已经部署好的Kafka集群里面添加机器是最正常不过的需求，而且添加起来非常地方便，我们需要做的事是从已经部署好的Kafka节点中复制相应的配置文件，然后把里面的broker id修改成全局唯一的，最后启动这个节点即可将它加入到现有Kafka集群中。

　　但是问题来了，新添加的Kafka节点并不会自动地分配数据，所以无法分担集群的负载，除非我们新建一个topic。但是现在我们想手动将部分分区移到新添加的Kafka节点上，Kafka内部提供了相关的工具来重新分布某个topic的分区。在重新分布topic分区之前，我们先来看看现在topic的各个分区的分布位置：

./bin/kafka-topics.sh --topic iteblog --describe --zookeeper www.iteblog.com:2181

Topic:iteblog PartitionCount:7 ReplicationFactor:2 Configs:

Topic: iteblog Partition: 0 Leader: 1 Replicas: 1,2 Isr: 1,2

Topic: iteblog Partition: 1 Leader: 2 Replicas: 2,3 Isr: 2,3

Topic: iteblog Partition: 2 Leader: 3 Replicas: 3,4 Isr: 3,4

Topic: iteblog Partition: 3 Leader: 4 Replicas: 4,1 Isr: 4,1

Topic: iteblog Partition: 4 Leader: 1 Replicas: 1,3 Isr: 1,3

Topic: iteblog Partition: 5 Leader: 2 Replicas: 2,4 Isr: 2,4

Topic: iteblog Partition: 6 Leader: 3 Replicas: 3,1 Isr: 3,1

从上面的输出可以看出，iteblog主题一共有7个分区，但是我们broker的个数只有4个，所以会导致某些broker维护更多的分区。现在我们在现有集群的基础上再添加一个Kafka节点，然后使用Kafka自带的kafka-reassign-partitions.sh工具来重新分布分区。该工具有三种使用模式：

　　1、generate模式，给定需要重新分配的Topic，自动生成reassign plan（并不执行）
　　2、execute模式，根据指定的reassign plan重新分配Partition
　　3、verify模式，验证重新分配Partition是否成功

现在我们需要将原先分布在broker 1-4节点上的分区重新分布到broker 1-5节点上，借助kafka-reassign-partitions.sh工具生成reassign plan，不过我们先得按照要求定义一个文件，里面说明哪些topic需要重新分区，文件内容如下：

[iteblog@www.iteblog.com ~]$ cat topics-to-move.json

{"topics": [{"topic": "iteblog"}],

"version":1

}

然后使用kafka-reassign-partitions.sh工具生成reassign plan



[iteblog@www.iteblog.com ~]$ bin/kafka-reassign-partitions.sh --zookeeper www.iteblog.com:2181 --topics-to-move-json-file topics-to-move.json --broker-list "1,2,3,4,5" --generate

Current partition replica assignment

{"version":1,"partitions":[{"topic":"iteblog","partition":3,"replicas":[4,1]},{"topic":"iteblog","partition":5,"replicas":[2,4]},{"topic":"iteblog","partition":4,"replicas":[1,3]},{"topic":"iteblog","partition":0,"replicas":[1,2]},{"topic":"iteblog","partition":6,"replicas":[3,1]},{"topic":"iteblog","partition":1,"replicas":[2,3]},{"topic":"iteblog","partition":2,"replicas":[3,4]}]}

Proposed partition reassignment configuration

{"version":1,"partitions":[{"topic":"iteblog","partition":3,"replicas":[3,5]},{"topic":"iteblog","partition":5,"replicas":[5,3]},{"topic":"iteblog","partition":4,"replicas":[4,1]},{"topic":"iteblog","partition":0,"replicas":[5,2]},{"topic":"iteblog","partition":6,"replicas":[1,4]},{"topic":"iteblog","partition":1,"replicas":[1,3]},{"topic":"iteblog","partition":2,"replicas":[2,4]}]}

Proposed partition reassignment configuration下面生成的就是将分区重新分布到broker 1-5上的结果。我们将这些内容保存到名为result.json文件里面（文件名不重要，文件格式也不一定要以json为结尾，只要保证内容是json即可），然后执行这些reassign plan：



[iteblog@www.iteblog.com ~]$ bin/kafka-reassign-partitions.sh --zookeeper www.iteblog.com:2181 --reassignment-json-file result.json --execute

Current partition replica assignment

{"version":1,"partitions":[{"topic":"iteblog","partition":3,"replicas":[4,1]},{"topic":"iteblog","partition":5,"replicas":[2,4]},{"topic":"iteblog","partition":4,"replicas":[1,3]},{"topic":"iteblog","partition":0,"replicas":[1,2]},{"topic":"iteblog","partition":6,"replicas":[3,1]},{"topic":"iteblog","partition":1,"replicas":[2,3]},{"topic":"iteblog","partition":2,"replicas":[3,4]}]}

Save this to use as the --reassignment-json-file option during rollback

Successfully started reassignment of partitions {"version":1,"partitions":[{"topic":"iteblog","partition":1,"replicas":[1,3]},{"topic":"iteblog","partition":5,"replicas":[5,3]},{"topic":"iteblog","partition":4,"replicas":[4,1]},{"topic":"iteblog","partition":6,"replicas":[1,4]},{"topic":"iteblog","partition":2,"replicas":[2,4]},{"topic":"iteblog","partition":0,"replicas":[5,2]},{"topic":"iteblog","partition":3,"replicas":[3,5]}]}

这样Kafka就在执行reassign plan，我们可以校验reassign plan是否执行完成：



[iteblog@www.iteblog.com ~]$ bin/kafka-reassign-partitions.sh --zookeeper www.iteblog.com:2181 --reassignment-json-file result.json --verify

Status of partition reassignment:

Reassignment of partition [iteblog,1] completed successfully

Reassignment of partition [iteblog,5] is still in progress

Reassignment of partition [iteblog,4] completed successfully

Reassignment of partition [iteblog,6] completed successfully

Reassignment of partition [iteblog,2] completed successfully

Reassignment of partition [iteblog,0] is still in progress

Reassignment of partition [iteblog,3] completed successfully

[iteblog@www.iteblog.com ~]$ bin/kafka-reassign-partitions.sh --zookeeper www.iteblog.com:2181 --reassignment-json-file result.json --verify

Status of partition reassignment:

Reassignment of partition [iteblog,1] completed successfully

Reassignment of partition [iteblog,5] completed successfully

Reassignment of partition [iteblog,4] completed successfully

Reassignment of partition [iteblog,6] completed successfully

Reassignment of partition [iteblog,2] completed successfully

Reassignment of partition [iteblog,0] completed successfully

Reassignment of partition [iteblog,3] completed successfully

可以看出，分区正在Reassignment的状态是still in progress；如果分区Reassignment完成则completed successfully，然后我们就可以看到分区已经按照生成的reassign plan进行，我们可以看下topic各个分区现在的分布情况：



[iteblog@www.iteblog.com ~]$ ./bin/kafka-topics.sh --topic iteblog --describe --zookeeper www.iteblog.com:2181

Topic:iteblog PartitionCount:7  ReplicationFactor:2 Configs:

  Topic: iteblog  Partition: 0  Leader: 5 Replicas: 5,2 Isr: 2,5

  Topic: iteblog  Partition: 1  Leader: 1 Replicas: 1,3 Isr: 3,1

  Topic: iteblog  Partition: 2  Leader: 2 Replicas: 2,4 Isr: 4,2

  Topic: iteblog  Partition: 3  Leader: 3 Replicas: 3,5 Isr: 3,5

  Topic: iteblog  Partition: 4  Leader: 1 Replicas: 4,1 Isr: 1,4

  Topic: iteblog  Partition: 5  Leader: 5 Replicas: 5,3 Isr: 3,5

  Topic: iteblog  Partition: 6  Leader: 1 Replicas: 1,4 Isr: 1,4

分区的分布的确和操作之前不一样了，broker 5上已经有分区分布上去了。但是仔细的同学应该可以发现，broker 4上居然没有分区的Leader，这肯定不是我们想要的！所以使用kafka-reassign-partitions.sh工具生成的reassign plan只是一个建议，方便大家而已。其实我们自己完全可以编辑一个reassign plan，然后执行它，如下：

{

"version": 1,

"partitions": [

{

"topic": "iteblog",

"partition": 0,

"replicas": [

1,

2

]

},

{

"topic": "iteblog",

"partition": 1,

"replicas": [

2,

3

]

},

{

"topic": "iteblog",

"partition": 2,

"replicas": [

3,

4

]

},

{

"topic": "iteblog",

"partition": 3,

"replicas": [

4,

5

]

},

{

"topic": "iteblog",

"partition": 4,

"replicas": [

5,

1

]

},

{

"topic": "iteblog",

"partition": 5,

"replicas": [

1,

3

]

},

{

"topic": "iteblog",

"partition": 6,

"replicas": [

2,

4

]

}

]

}

将上面的json数据文件保存到result.json文件中，然后也是执行它：



[iteblog@www.iteblog.com ~]$ bin/kafka-reassign-partitions.sh --zookeeper www.iteblog.com:2181 --reassignment-json-file result.json --execute

等这个reassign plan执行完，我们再来看看分区的分布：



[iteblog@www.iteblog.com ~]$  ./bin/kafka-topics.sh --topic iteblog --describe --zookeeper www.iteblog.com:2181

Topic:iteblog PartitionCount:7  ReplicationFactor:2 Configs:

  Topic: iteblog  Partition: 0  Leader: 1 Replicas: 1,2 Isr: 2,1

  Topic: iteblog  Partition: 1  Leader: 2 Replicas: 2,3 Isr: 3,2

  Topic: iteblog  Partition: 2  Leader: 3 Replicas: 3,4 Isr: 4,3

  Topic: iteblog  Partition: 3  Leader: 4 Replicas: 4,5 Isr: 5,4

  Topic: iteblog  Partition: 4  Leader: 5 Replicas: 5,1 Isr: 1,5

  Topic: iteblog  Partition: 5  Leader: 1 Replicas: 1,3 Isr: 3,1

  Topic: iteblog  Partition: 6  Leader: 2 Replicas: 2,4 Isr: 4,2

果然已经按照我们需求分布了。。

Kafka集群扩展以及重新分布分区的更多相关文章

Kafka 集群在马蜂窝大数据平台的优化与应用扩展
马蜂窝技术原创文章,更多干货请订阅公众号:mfwtech Kafka 是当下热门的消息队列中间件,它可以实时地处理海量数据,具备高吞吐.低延时等特性及可靠的消息异步传递机制,可以很好地解决不同系统间数 ...
（三）kafka集群扩容后的topic分区迁移
kafka集群扩容后的topic分区迁移 kafka集群扩容后,新的broker上面不会数据进入这些节点,也就是说,这些节点是空闲的:它只有在创建新的topic时才会参与工作.除非将已有的partit ...
kafka集群扩容后的topic分区迁移
https://www.cnblogs.com/honeybee/p/5691921.html kafka集群扩容后,新的broker上面不会数据进入这些节点,也就是说,这些节点是空闲的:它只有在创建 ...
Kafka集群中 topic数据的分区迁移到其他broker
前言 kafka集群扩容后,新的broker上面不会数据进入这些节点,也就是说,这些节点是空闲的:它只有在创建新的topic时才会参与工作.除非将已有的partition迁移到新的服务器上面:所以需要 ...
kafka集群在消息消费出现无法找到topic分区的处理解决
最近几天在做spark数据同步过程中,中间通过kafka集群处理消息,每次同步到一半就会出现同步不了查看日志如下: 最开始看到这个问题很懵逼,完全找不到解决问题的切入口,期间也询问了架构师-因为这个 ...
ELK+Kafka集群日志分析系统
ELK+Kafka集群分析系统部署因为是自己本地写好的word文档复制进来的.格式有些出入还望体谅.如有错误请回复.谢谢! 一. 系统介绍 2 二. 版本说明 3 三. 服务部署 3 1) JDK部 ...
Kafka集群的安装和使用
Kafka是一种高吞吐量的分布式发布订阅的消息队列系统,原本开发自LinkedIn,用作LinkedIn的活动流(ActivityStream)和运营数据处理管道(Pipeline)的基础.现在它已被 ...
Kafka【第一篇】Kafka集群搭建
Kafka初识 1.Kafka使用背景在我们大量使用分布式数据库.分布式计算集群的时候,是否会遇到这样的一些问题: 我们想分析下用户行为(pageviews),以便我们设计出更好的广告位我想对用户 ...
如何为Kafka集群选择合适的Partitions数量
转载:http://blog.csdn.net/odailidong/article/details/52571901 这是许多kafka使用者经常会问到的一个问题.本文的目的是介绍与本问题相关的一些 ...

随机推荐

【转】Python判断字符串是否为字母或者数字
str_1 = " str_2 = "Abc" str_3 = "123Abc" #用isdigit函数判断是否数字 print(str_1.isdi ...
【HAOI2016】食物链
HA真是弱…… 原题: 1.食物链[问题描述]如图所示为某生态系统的食物网示意图,据图回答第1小题． 1.数一数,在这个食物网中有几条食物链( )现在给你n个物种和m条能量流动关系,求其中的食物链条数 ...
sqlserver 2008 r2 下载地址和序列号，可用迅雷下载
sqlserver 2008 r2 下载地址,可用迅雷下载下载sqlserver 2008 r2 ,微软用了一个下载器,经过从下载器上,将他的地址全部用键盘敲了下来.最终的简体中文版地址如下: 32 ...
codevs2189数字三角形（%100）
题目:http://codevs.cn/problem/2189/ %100的话就加一维状态.把最优性改为可行性(存在性). #include<iostream> #include< ...
linux sh文件提示 no such file or directory
Linux执行.sh文件,提示No such file or directory的问题的解决方法 12-06-28 16:59作者:love__coder Linux执行.sh文件,提示No such ...
WCF揭秘学习笔记（5）：WF定制活动
WF(Windows Workflow Foundation,Windows工作流基础)为.NET提供了一种基于模型的.声明方式的过程执行引擎,它改变了传统的通过一行行编写代码来开发服务功能的方式. ...
eclipse中的XML文件无法快捷键注释问题
好多朋友都发现在ME6.0或跟高版本中“Ctrl+Shift+c”或者是“Ctrl+Shift+/”快捷键无论你怎么点,它就是不起作用,恼火吧? 百度还是 google 都没有找到合理的说法,更有 ...
解决Qt Creator编译输出窗口乱码的问题
设置环境变量LC_ALL为en_US. 附注:将乱码复制到文本编辑器(如Notepad++)后将编码设置为utf-8,可以看到正确的文字. 看样子是编译输出窗口的编码设置出了问题,或者是gcc的输出编 ...
Java高并发综合
这篇文章是研一刚入学时写的,今天整理草稿时才被我挖出来.当时混混沌沌的面试,记下来了一些并发的面试问题,很多还没有回答.到现在也学习了不少并发的知识,回过头来看这些问题和当时整理的答案,漏洞百出又十分 ...
关于office2016桌面新建不显示execl问题
在百度,google找了很多方法都没有文档可以解决此问题,office2016安装完在新建是由ececl的,应该是我用了清理注册表工具,对execl项进行清理,造成没有execl,所以贴出原版xls, ...

Kafka集群扩展以及重新分布分区

Kafka集群扩展以及重新分布分区的更多相关文章

随机推荐

热门专题