kafka多线程消费topic的问题

案例：

　　topic：my-topic，分区：6

　　消费者：部署三台机器，每台机器上面开启6个线程消费。

　　消费结果：只有一台机器可以正常消费，另外两台机器直接输出六条告警日志：

No broker partitions consumed by consumer thread my-topic-group_adfc6be4a509-1496976531798-d70f9a43-3 for topic my-topic

No broker partitions consumed by consumer thread my-topic-group_adfc6be4a509-1496976531798-d70f9a43-1 for topic my-topic

No broker partitions consumed by consumer thread my-topic-group_adfc6be4a509-1496976531798-d70f9a43-2 for topic my-topic

No broker partitions consumed by consumer thread my-topic-group_adfc6be4a509-1496976531798-d70f9a43-4 for topic my-topic

No broker partitions consumed by consumer thread my-topic-group_adfc6be4a509-1496976531798-d70f9a43-6 for topic my-topic

No broker partitions consumed by consumer thread my-topic-group_adfc6be4a509-1496976531798-d70f9a43-5 for topic my-topic

在源码分析之前，先给个图示吧，花了两个小时才画完。

源码分析：

for (topic <- ctx.myTopicThreadIds.keySet) {

　　　// curConsumers = 6*3 = 18，当前消费者数量

      val curConsumers = ctx.consumersForTopic(topic)

　　　// curPartitions = 6，当前分区数量

      val curPartitions: Seq[Int] = ctx.partitionsForTopic(topic)

　　　// nPartsPerConsumer = 6/18 = 0，平均每个消费者能分到的分区数【取整】

      val nPartsPerConsumer = curPartitions.size / curConsumers.size

　　　/*

         nConsumersWithExtraPart = 6%18 = 6，如果分割不均匀（消费者和分区数不是倍数关系），那么前N个消费者将会消费一个额外的分区

         这里得出结果是6，那么其含义可以理解为前6个消费者可以比其他消费多消费一个分区，前6个各占有一个分区，后面12个消费者各占有0个分区

       */

      val nConsumersWithExtraPart = curPartitions.size % curConsumers.size

      info("Consumer " + ctx.consumerId + " rebalancing the following partitions: " + curPartitions +

        " for topic " + topic + " with consumers: " + curConsumers)

      for (consumerThreadId <- curConsumers) {

　　　　// myConsumerPosition是指当前consumerThreadId在消费者集合中的位置

        val myConsumerPosition = curConsumers.indexOf(consumerThreadId)

        assert(myConsumerPosition >= 0)

　　　　/*

             startPart = 0*6 + myConsumerPosition.min(6)，min函数表示取两个数值中小的一个，那么startPart的值就分成了两个部分：[0-5] -> 0-5,[6-17] -> 6

             分区升序排列之后，startPart表示当前消费者从哪个分区开始消费。

         */

        val startPart = nPartsPerConsumer * myConsumerPosition + myConsumerPosition.min(nConsumersWithExtraPart)

　　　　/*

             nParts = 0 + (myConsumerPosition + 1 > 6 ) ? 0 : 1 ，这里nParts的值也分成了两部分，[0-5] -> 1 , [6-17] -> 0

            如果消费者数量小于分区数量，则前nConsumersWithExtraPart个消费者的分区数量会是2，nParts只会有三种值【0,1,2】，

            表示当前消费者可以消费分区的数量。

        */

        val nParts = nPartsPerConsumer + (if (myConsumerPosition + 1 > nConsumersWithExtraPart) 0 else 1)

        /**

         *   Range-partition the sorted partitions to consumers for better locality.

         *  The first few consumers pick up an extra partition, if any.

         */

　　　　// 这里myConsumerPosition在[6-17]的comsumer都会直接告警，也就是上文提到的【额外部分消费者】

        if (nParts <= 0)

          warn("No broker partitions consumed by consumer thread " + consumerThreadId + " for topic " + topic)

        else {

　　　　　　// 这里myConsumerPosition在[0-5]的comsumer进入topic分区分配

          for (i <- startPart until startPart + nParts) {

            val partition = curPartitions(i)

            info(consumerThreadId + " attempting to claim partition " + partition)

            // record the partition ownership decision

            val assignmentForConsumer = partitionAssignment.getAndMaybePut(consumerThreadId.consumer)

            assignmentForConsumer += (TopicAndPartition(topic, partition) -> consumerThreadId)

          }

        }

      }

}

结果：topic里面的每个partition只会由一个线程消费，在分配的时候就已经指定好，如果有消费者线程加入或者退出，则会重新开始分配。

kafka多线程消费topic的问题的更多相关文章

kafka多线程消费及处理和手动提交处理方案设计[转]
转自:http://blog.csdn.net/haoyifen/article/details/54692503 kafka与其他消息队列不同的是, kafka的消费者状态由外部( 消费者本身或者类 ...
kafka 多线程消费
一. 1.Kafka的消费并行度依赖Topic配置的分区数,如分区数为10,那么最多10台机器来并行消费(每台机器只能开启一个线程),或者一台机器消费(10个线程并行消费).即消费并行度和分区数一致. ...
kafka多线程消费
建立kafka消费类ConsumerRunnable ,实现Runnable接口: import com.alibaba.fastjson.JSON; import com.alibaba.fastj ...
Kafka创建&查看topic，生产&消费指定topic消息
启动zookeeper和Kafka之后,进入kafka目录(安装/启动kafka参考前面一章:https://www.cnblogs.com/cici20166/p/9425613.html) 1.创 ...
NET中解决KafKa多线程发送多主题
NET中解决KafKa多线程发送多主题一般在KafKa消费程序中消费可以设置多个主题,那在同一程序中需要向KafKa发送不同主题的消息,如异常需要发到异常主题,正常的发送到正常的主题,这时候就需要实 ...
Kafka vs RocketMQ—— Topic数量对单机性能的影响-转自阿里中间件
引言上一期我们对比了三类消息产品(Kafka.RabbitMQ.RocketMQ)单纯发送小消息的性能,受到了程序猿们的广泛关注,其中大家对这种单纯的发送场景感到并不过瘾,因为没有任何一个网站的业务 ...
Kafka重复消费和丢失数据研究
Kafka重复消费原因底层根本原因:已经消费了数据,但是offset没提交. 原因1:强行kill线程,导致消费后的数据,offset没有提交. 原因2:设置offset为自动提交,关闭kafka时 ...
Flume简介与使用（三）——Kafka Sink消费数据之Kafka安装
前面已经介绍了如何利用Thrift Source生产数据,今天介绍如何用Kafka Sink消费数据. 其实之前已经在Flume配置文件里设置了用Kafka Sink消费数据 agent1.sinks ...
Kafka动态增加Topic的副本
一.kafka的副本机制由于Producer和Consumer都只会与Leader角色的分区副本相连,所以kafka需要以集群的组织形式提供主题下的消息高可用.kafka支持主备复制,所以消息具备高 ...

随机推荐

CodeForces 681B Economy Game (暴力)
题意:给定一个数,问能不能找到非负 a, b, c,使得 a × 1 234 567 + b × 123 456 + c × 1 234 = n. 析:二重循环,去确定c. 代码如下: #inclu ...
Mysal表类型的区别-MyISAM，InnoDB
1/ISAM ISAM是一个定义明确且历经时间考验的数据表格管理方法,它在设计之时就考虑到数据库被查询的次数要远大于更新的次数.因此,ISAM执行读取操作的速度很快,而且不占用大量的内存和存储资源.I ...
canvas里调用getImageData的报security的问题
canvas元素支持绘制任意图片元素: var ctx = document.getElementById("canvas").getContext("2d") ...
（字符串键盘转换）Convert QWERTY to Dvorak -- zoj -- 5526
链接: http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=5526 Time Limit: 2 Seconds Memor ...
TFS 2015新功能之一，当前迭代查询标记
TFS 2015发布在即,有幸作为MVP提前获得了TFS的RTM版本,下面就TFS 2015的新功能做一些介绍: TFS 2015新功能之一,当前迭代查询标记在TFS的查询中,可以将" ...
记一次Angular2环境搭建及My First Angular App小demo呈现
参考连接?不如说是照搬链接.AngularJs官网地址快速起步地址. 对于一个一直只是用jq,偶尔学习点Knockout js,了解一点mvvm结构的前端来说,学习Angular2还是有点困难的.好了 ...
VUE环境安装和创建项目
1.首先要安装nodejs和npm. 下载nodejs安装,下载地址:https://nodejs.org/en/ 安装很简单一路next即可. 安装完成后可以在cmd窗口输入node -v 和 np ...
Kafka与.net core（二）zookeeper
1.zookeeper简单介绍 1.1作用 zookeeper的作用是存储kafka的服务器信息,topic信息,和cunsumer信息.如下图: 而zookeeper是个什么东西呢?简单来说就是一个 ...
在 Cef 中实现 C++ 与 JavaScript 交互场景分析
此文已由作者邓佳佳授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验本文主要介绍 CEF 场景中 C++ 和 JavaScript 交互(以下简称 JS Bridge)中的一些重 ...
nova 宿主机重启自动恢复虚拟机运行状态
1. 宿主机重启自动恢复虚拟机运行状态 1.1 参数描述与默认值 # Whether to start guests that were running before the host reboote ...

kafka多线程消费topic的问题

kafka多线程消费topic的问题的更多相关文章

随机推荐

热门专题