kafka分区及副本在broker的分配

部分内容參考自：http://blog.csdn.net/lizhitao/article/details/41778193

以下以一个Kafka集群中4个Broker举例，创建1个topic包括4个Partition，2 Replication；数据Producer流动如图所看到的：
(1)

pic

(2)当集群中新增2节点，Partition添加到6个时分布情况例如以下：

副本分配逻辑规则例如以下：
在Kafka集群中，每一个Broker都有均等分配Partition的Leader机会。
上述图Broker Partition中，箭头指向为副本。以Partition-0为例:broker1中parition-0为Leader。Broker2中Partition-0为副本。

上述图种每一个Broker(依照BrokerId有序)依次分配主Partition,下一个Broker为副本，如此循环迭代分配，多副本都遵循此规则。

副本分配算法例如以下：
将全部N Broker和待分配的i个Partition排序.
将第i个Partition分配到第(i mod n)个Broker上.
将第i个Partition的第j个副本分配到第((i + j) mod n)个Broker上.

其实以上的算法是有误的，由于非常明显。每一个topic的分区0都会被分配在broker 0上。第1个分区都分配到broker 1上。直到partition的id超过broker的数据才開始从头開始反复，这样会导致前面几台机器的压力比后面的机器压力更大。

因此。kafka是先随机挑选一个broker放置分区0，然后再按顺序放置其他分区。

例如以下图的情况：

Topic:ljh_test3 PartitionCount:10       ReplicationFactor:2     Configs:

    Topic: ljh_test3        Partition: 0    Leader: 5       Replicas: 5,6   Isr: 5,6

    Topic: ljh_test3        Partition: 1    Leader: 6       Replicas: 6,7   Isr: 6,7

    Topic: ljh_test3        Partition: 2    Leader: 7       Replicas: 7,2   Isr: 7,2

    Topic: ljh_test3        Partition: 3    Leader: 2       Replicas: 2,3   Isr: 2,3

    Topic: ljh_test3        Partition: 4    Leader: 3       Replicas: 3,4   Isr: 3,4

    Topic: ljh_test3        Partition: 5    Leader: 4       Replicas: 4,5   Isr: 4,5

    Topic: ljh_test3        Partition: 6    Leader: 5       Replicas: 5,7   Isr: 5,7

    Topic: ljh_test3        Partition: 7    Leader: 6       Replicas: 6,2   Isr: 6,2

    Topic: ljh_test3        Partition: 8    Leader: 7       Replicas: 7,3   Isr: 7,3

    Topic: ljh_test3        Partition: 9    Leader: 2       Replicas: 2,4   Isr: 2,4

这里分区0放到了broker5中。分区1–broker6。分区2—broker7….

再看一个样例：

Topic:ljh_test2 PartitionCount:10       ReplicationFactor:2     Configs:

    Topic: ljh_test2        Partition: 0    Leader: 2       Replicas: 2,7   Isr: 2,7

    Topic: ljh_test2        Partition: 1    Leader: 3       Replicas: 3,2   Isr: 3,2

    Topic: ljh_test2        Partition: 2    Leader: 4       Replicas: 4,3   Isr: 4,3

    Topic: ljh_test2        Partition: 3    Leader: 5       Replicas: 5,4   Isr: 5,4

    Topic: ljh_test2        Partition: 4    Leader: 6       Replicas: 6,5   Isr: 6,5

    Topic: ljh_test2        Partition: 5    Leader: 7       Replicas: 7,6   Isr: 7,6

    Topic: ljh_test2        Partition: 6    Leader: 2       Replicas: 2,3   Isr: 2,3

    Topic: ljh_test2        Partition: 7    Leader: 3       Replicas: 3,4   Isr: 3,4

    Topic: ljh_test2        Partition: 8    Leader: 4       Replicas: 4,5   Isr: 4,5

    Topic: ljh_test2        Partition: 9    Leader: 5       Replicas: 5,6   Isr: 5,6

kafka分区及副本在broker的分配的更多相关文章

详细解析kafka之kafka分区和副本
本篇主要介绍kafka的分区和副本,因为这两者是有些关联的,所以就放在一起来讲了,后面顺便会给出一些对应的配置以及具体的实现代码,以供参考~ 1.kafka分区机制分区机制是kafka实现高吞吐的秘 ...
kafka 分区和副本以及kafaka 执行流程，以及消息的高可用
1.Kafka概览 Apache下的项目Kafka(卡夫卡)是一个分布式流处理平台,它的流行是因为卡夫卡系统的设计和操作简单,能充分利用磁盘的顺序读写特性.kafka每秒钟能有百万条消息的吞吐量,因此 ...
Kafka集群中 topic数据的分区迁移到其他broker
前言 kafka集群扩容后,新的broker上面不会数据进入这些节点,也就是说,这些节点是空闲的:它只有在创建新的topic时才会参与工作.除非将已有的partition迁移到新的服务器上面:所以需要 ...
二、kafka 中央控制器、主题、分区、副本
集群和中央控制器一个独立的Kafka服务器被称为broker.broker用来接收来自生产者的消息,为消息设置偏移量,并把消息保存到磁盘.换句话说,多个kafka实例组成kafka集群,每个实例(s ...
Kafka分区分配策略分析——重点：StickyAssignor
“ 为什么Kafka在RangeAssigor.RoundRobinAssignor的基础上,又新增了PartitionAssignor,它解决了什么问题?” 背景用过Kafka的同学应该都知道Ka ...
Kafka技术内幕读书笔记之（六）存储层——服务端处理读写请求、分区与副本
如下图中分区到日志的虚线表示 : 业务逻辑层的一个分区对应物理存储层的一个日志 . 消息集到数据文件的虚线表示 : 客户端发送的消息集最终会写入日志分段对应的数据文件,存储到Kafka的消息代理节 ...
Kafka分区分配策略-RangeAssignor、RoundRobinAssignor、StickyAssignor
引言按照Kafka默认的消费逻辑设定,一个分区只能被同一个消费组(ConsumerGroup)内的一个消费者消费.假设目前某消费组内只有一个消费者C0,订阅了一个topic,这个topic包含7个分区 ...
Kafka分区分配策略（Partition Assignment Strategy）
众所周知,Apache Kafka是基于生产者和消费者模型作为开源的分布式发布订阅消息系统(当然,目前Kafka定位于an open-source distributed event streamin ...
Kafka 0.8 副本同步机制理解
Kafka的普及在很大程度上归功于它的设计和操作简单,如何自动调优Kafka副本的工作,挑战之一:如何避免follower进入和退出同步副本列表(即ISR).如果某些topic的部分partition ...

随机推荐

for loop
https://www.cnblogs.com/EasonJim/p/8315939.html
Bamboo基础概念
1.project 1)提供报告.展板.连接 |——2.plan 1)指定默认代码仓库(同一个仓库) 2)构建触发条件的配置 3)构建结果的发送与通知 ...
flask框架----信号
一.实例化补充 instance_path和instance_relative_config是配合来用的.这两个参数是用来找配置文件的,当用app.config.from_pyfile('settin ...
C语言实例：数组与字符串
数组: #include <stdio.h> #include <stdlib.h> #define ARRAY_SIZE(Array) (sizeof (Array) / s ...
MI200e电力线通讯
最近做课设,选了电力线通讯这种途径,经过百度google等一番查询,最终敲定了mi200e这块国产芯片. 课设要求就是双机通讯,互传传感器信息以及模拟一个时钟然后淘宝买了拆机的成品,我拿回来把mcu ...
如何快速实现 markdown 转 HTML 文档？
我想要在 Github 上开一个主题博客,我希望通过 Markdown 语法写作,然后生成 HTML 并附带自定义样式显示在网页上. 我找到了 gulp-markdown 这个库,看起来符合我的需求场 ...
AJAX理解
注:首先我们要明白请求是什么?请求分两种,一.静态请求(如:返回js.css.图片等) 二.动态请求(返回跟用户有关的数据) http(apache.nginx等)服务器会判断如果是一个静态请求,会直 ...
#python计算结果百位500向下取整，（0-499取000，500-999取500)
!/usr/bin/env python coding:utf-8 计算结果百位500向下取整,(0-499取000,500-999取500) import math calc_Amount = fl ...
[codechef]SnackDown 2017 Online Elimination Round Prefix XOR
预处理后主席树维护首先得出最后的答案为 \(\sum_{i=l}^{r}{min(right[i],r)-i+1}\) \(ri[i]\)表示i最远的上升序列(即代码中的f[i]) step1 那么 ...
pixi.js(入门)
1.关于一个关于HTML5 2D渲染引擎,它的独特之处在于其拥有了canvas回调功能的WebGL,速度快,能够兼容所有设备,简单得说也就是跨平台了,我用的开发工具是WebStorm 2.参考API ...

kafka分区及副本在broker的分配

kafka分区及副本在broker的分配的更多相关文章

随机推荐

热门专题