消费者从Broker中获取消息的方式有两种:pull拉取方式和push推动方式。消费者组对于消息消费的模 式又分为两种:集群消费Clustering和广播消费Broadcasting。

1. 获取消息的类型

拉取式消费

Consumer主动从Broker中拉取消息,主动权由Consumer控制。一旦获取了批量消息,就会启动消费过 程。

不过,该方式的实时性较弱,即Broker中有了新的消息时消费者并不能及时发现并消费。

由于拉取时间间隔是由用户指定的,所以在设置该间隔时需要注意平稳:间隔太短,空请求比 例会增加;间隔太长,消息的实时性太差

推送式消费

该模式下Broker收到数据后会主动推送给Consumer。该获取方式一般实时性较高。

该获取方式是典型的发布-订阅模式,即Consumer向其关联的Queue注册了监听器,一旦发现有新的 消息到来就会触发回调的执行,回调方法是Consumer去Queue中拉取消息。

而这些都是基于Consumer 与Broker间的长连接的。长连接的维护是需要消耗系统资源的。

对比

  • pull:需要应用去实现对关联Queue的遍历,实时性差;但便于应用控制消息的拉取

  • push:封装了对关联Queue的遍历,实时性强,但会占用较多的系统资源

2. 消费模式

2.1 广播消费

广播消费模式下,相同Consumer Group的每个Consumer实例都接收同一个Topic的全量消息。即每条消息都会被发送到Consumer Group中的每个Consumer。

2.2 集群消费

集群消费模式下,相同Consumer Group的每个Consumer实例平均分摊同一个Topic的消息。即每条消 息只会被发送到Consumer Group中的某个Consumer。

2.3 消息进度保存

广播模式:消费进度保存在consumer端。因为广播模式下consumer group中每个consumer都会消费所有消息,但它们的消费进度是不同。所以consumer各自保存各自的消费进度。

集群模式:消费进度保存在broker中。consumer group中的所有consumer共同消费同一个Topic 中的消息,同一条消息只会被消费一次。消费进度会参与到了消费的负载均衡中,故消费进度是 需要共享的。下图是broker中存放的各个Topic的各个Queue的消费进度。

以下是broker下config文件夹下存放的某个队列的进度, 保存在服务端, 其对应的 0,1,2,3代表persons topic 下的四个queue,

对应的 6,7,6,6 则表示其消费者的消费进度

3. Rebalance机制

Rebalance机制讨论的前提是:集群消费。

3.1 什么是Rebalance以及Rebalance可能会出现的问题

Rebalance即再均衡,指的是,将⼀个Topic下的多个Queue在同⼀个Consumer Group中的多个 Consumer间进行重新分配的过程。

如下图所示:

Rebalance机制的本意是为了提升消息的并行消费能力。

例如,⼀个Topic下5个队列,在只有1个消费 者的情况下,这个消费者将负责消费这5个队列的消息。

如果此时我们增加⼀个消费者,那么就可以给 其中⼀个消费者分配2个队列,给另⼀个分配3个队列,从而提升消息的并行消费能力。

Rebalance限制

由于⼀个队列最多分配给⼀个消费者,因此当某个消费者组下的消费者实例数量大于队列的数量时, 多余的消费者实例将分配不到任何队列。

Rebalance可能导致的问题

  • 消费暂停:在只有一个Consumer时,其负责消费所有队列;在新增了一个Consumer后会触发 Rebalance的发生。此时原Consumer就让出部分队列的消费,导致这些队列的消费暂停,等到这些队列分配给新的Consumer 后,这些暂停消费的队列才能继续被消费。
  • 消费重复:Consumer 在消费新分配给自己的队列时,必须接着上一个 Consumer 提交的消费进度的offset 继续消费。然而默认情况下,offset是异步提交的,这个异步性导致上一个Consumer提交到Broker的offset与实际消费的消息并不一致。导致新的Consumer可能会接着已经在老Consumer中消费的消息进行消费, 重复消费消息。
  • 消费突刺:由于Rebalance可能导致重复消费,如果需要重复消费的消息过多,或者因为Rebalance暂停 时间过长从而导致积压了部分消息。那么有可能会导致在Rebalance结束之后瞬间需要消费很多消息。

3.2 Rebalance会出现的原因

导致Rebalance产生的原因,无非就两个:消费者所订阅Topic的Queue数量发生变化,或消费者组中消 费者的数量发生变化。

Queue数量发生变化的场景

  • Broker扩容或缩容
  • Broker升级运维
  • Broker与NameServer间的网络异常
  • Queue扩容或缩容

消费者数量发生变化的场景

  • Consumer Group扩容或缩容
  • Consumer升级重启
  • Consumer与NameServer间网络异常

Rebalance过程

在Broker中维护着多个Map集合,这些集合中动态存放着每个Topic中Queue的信息、Consumer Group 中Consumer实例的信息。一旦发现消费者所订阅的Queue数量发生变化,或消费者组中消费者的数量发生变化,立即向Consumer Group中的每个实例发出Rebalance通知。

  1. TopicConfigManager:key是topic名称,value是TopicConfig。TopicConig中维护着该Topic中所有Queue的数据。
  2. ConsumerManager:key是Consumser Group Id,value是ConsumerGroupInfo。 ConsumerGroupInfo中维护着该Group中所有Consumer实例数据。
  3. ConsumerOffsetManager:key为Topic与订阅该Topic的Group的组合,即topic@group, value是一个内层Map。内层Map的key为QueueId,内层Map的value为该Queue的消费进度 offset。

Consumer实例在接收到通知后会采用Queue分配算法自己获取到相应的Queue,即由Consumer实例自主进行Rebalance。

4. Queue分配算法

一个Topic中的Queue只能由一个Consumer Group中的单个Consumer进行消费,而一个Consumer可以同时 消费多个Queue中的消息。那么Queue与Consumer间的配对关系是如何确定的,即Queue要分配给哪 个Consumer进行消费,也是有算法策略的。

常见的有四种策略。这些策略是通过在创建Consumer时的构造器传进去的。

4.1 平均分配策略

该算法是要根据avg = QueueCount / ConsumerCount 的计算结果进行分配的。

如果能够整除, 则按顺序将avg个Queue逐个分配Consumer;如果不能整除,则将多余出的Queue按照Consumer顺序 逐个分配。

即,先计算好每个Consumer应该分得几个Queue,然后再依次将这些数量的Queue逐个分配个Consumer。

4.2 环形平均策略

环形平均算法是指,根据消费者的顺序,依次再由queue队列组成的环形图中逐个分配。

该算法不用事先计算每个Consumer需要分配几个Queue,直接一个一个分即可。非连续

4.3 一致性hash策略

该算法会将consumer的hash值作为Node节点存放到hash环上,然后将queue的hash值也放到hash环 上,

通过顺时针方向,距离queue最近的那个consumer就是该queue要分配的consumer。

该算法存在的问题:可能分配不均。

4.4 同机房策略

该算法会根据queue的部署机房位置和consumer的位置,过滤出当前consumer相同机房的queue。

然后按照平均分配策略或环形平均策略对同机房queue进行分配。

如果没有同机房queue,则按照平均分配策略或环形平均策略对所有queue进行分配。

4.5 对比

一致性hash算法缺点:

两种平均分配策略的分配效率较高,一致性hash策略的较低。

因为一致性hash算法较复杂。另外,一 致性hash策略分配的结果也很大可能上存在不平均的情况。

一致性hash算法优点:

其可以有效减少由于消费者组扩容或缩容所带来的大量的Rebalance。

以平均分配算法为例: 如果加一个consumer的时候,分配发生的变化,将有七个Queue 发生转移, 进行Rebalance

而反观一致性hash算法, 其只影响到了极少一部分的Queue,其他将不受影响

一致性hash算法的应用场景: Consumer数量变化较频繁的场景。

4.6 至少一次原则

RocketMQ有一个原则:每条消息必须要被成功消费一次

那么什么是成功消费呢?Consumer在消费完消息后会向其消费进度记录器提交其消费消息的offset, offset被成功记录到记录器中,那么这条消费就被成功消费了。

什么是消费进度记录器?

对于广播消费模式来说,Consumer本身就是消费进度记录器。 对于集群消费模式来说,Broker是消费进度记录器。

RocketMQ(4) 消息的消费的更多相关文章

  1. 【RocketMQ】消息的消费

    上一讲[RocketMQ]消息的拉取 消息消费 当RocketMQ进行消息消费的时候,是通过ConsumeMessageConcurrentlyService的submitConsumeRequest ...

  2. 太坑了,我竟然从RocketMQ源码中扒出了7种导致消息重复消费的原因

    大家好,我是三友~~ 在众多关于MQ的面试八股文中有这么一道题,"如何保证MQ消息消费的幂等性". 为什么需要保证幂等性呢?是因为消息会重复消费. 为什么消息会重复消费? 明明已经 ...

  3. 分布式消息队列RocketMQ&Kafka -- 消息的“顺序消费”

    在说到消息中间件的时候,我们通常都会谈到一个特性:消息的顺序消费问题.这个问题看起来很简单:Producer发送消息1, 2, 3... Consumer按1, 2, 3...顺序消费. 但实际情况却 ...

  4. RocketMQ的消息发送及消费

    RocketMQ消息支持的模式: 消息支持的模式分为三种:NormalProducer(普通同步),消息异步发送,OneWay. 消息同步发送: 普通消息的发送和接收在前面已经演示过了,在前面的案例中 ...

  5. RocketMQ源码 — 九、 RocketMQ延时消息

    上一节消息重试里面提到了重试的消息可以被延时消费,其实除此之外,用户发送的消息也可以指定延时时间(更准确的说是延时等级),然后在指定延时时间之后投递消息,然后被consumer消费.阿里云的ons还支 ...

  6. 聊一聊顺序消息(RocketMQ顺序消息的实现机制)

    当我们说顺序时,我们在说什么? 日常思维中,顺序大部分情况会和时间关联起来,即时间的先后表示事件的顺序关系. 比如事件A发生在下午3点一刻,而事件B发生在下午4点,那么我们认为事件A发生在事件B之前, ...

  7. RocketMQ源码 — 十、 RocketMQ顺序消息

    RocketMQ本身支持顺序消息,在使用上发送顺序消息和非顺序消息有所区别 发送顺序消息 SendResult sendResult = producer.send(msg, new MessageQ ...

  8. rocketmq有序消息

    RocketMQ提供的顺序消费消息实现是使用的FIFO 先进先出算法 Producer消息发送 public class Producer { public static void main(Stri ...

  9. RocketMQ源码分析之RocketMQ事务消息实现原理上篇(二阶段提交)

    在阅读本文前,若您对RocketMQ技术感兴趣,请加入 RocketMQ技术交流群 根据上文的描述,发送事务消息的入口为: TransactionMQProducer#sendMessageInTra ...

  10. RocketMQ事务消息实现分析

    这周RocketMQ发布了4.3.0版本,New Feature中最受关注的一点就是支持了事务消息: 今天花了点时间看了下具体的实现内容,下面是简单的总结. RocketMQ事务消息概要 通过冯嘉发布 ...

随机推荐

  1. js遍历树形结构并返回所有的子节点id值

    场景 很多时候我么需要返回返回tree结构下的所有自己节点 很显然这个时候需要遍历了 废话不多说 直接递归遍历 数据结构 var treeData = [{ id: 111, title: " ...

  2. 通过图片地址获取图片的base64,再通过base64获取二进制数据

    class Program { static void Main(string[] args) { string base64 = getFileBase64("D:\\Users\\Vat ...

  3. CMake出错的处理

    在windows上使用cmake来c++的程序,遇到一个问题 问题排查 试过在电脑上单独使用gcc是可以编译成功的,那么就可能是IDE集成的问题了 IDE的编译工具链从mingw换成vs,编译通过 让 ...

  4. 深度学习基础入门篇[六(1)]:模型调优:注意力机制[多头注意力、自注意力],正则化【L1、L2,Dropout,Drop Connect】等

    深度学习基础入门篇[六(1)]:模型调优:注意力机制[多头注意力.自注意力],正则化[L1.L2,Dropout,Drop Connect]等 1.注意力机制 在深度学习领域,模型往往需要接收和处理大 ...

  5. 2.4 CE修改器:代码替换功能

    代码替换功能,需要使用 Cheat Engine 工具的"代码查找"功能,来查找游戏数据存储在内存中的地址.首先找到当前数值的存储地址,并将其添加到下方地址列表中.然后右键单击该地 ...

  6. C/C++ 实现正反向端口映射

    通常服务器是放在内网中,内部局域网中,并且分配了私有IP地址,而如果想要在外部直接访问内部服务器则需要端口映射,端口映射也叫做端口转发,或者叫做虚拟服务器,在渗透时当我们拿到目标机器权限以后,目标机器 ...

  7. 分布式压测之locust和Jmeter的使用

    受限于单台机器的配置问题,我们在单台机器上达不到一个很高的压测并发数,那这个时候就需要引入分布式压测 分布式压测原理: 一般通过局域网把不同测试计算机链接到一起,达到测试共享.分散操作.集中管理的目的 ...

  8. 开发者必看!苹果App Store重大调整:App上架必须有ICP备案号

    日前,苹果App Store迎来重大调整,即日起中国大陆上架的App必须具备有效的互联网信息服务提供者(ICP)备案号. 简单说,新App现在需要填写备案号才能提审,这就要求开发者应用需有备案号,另外 ...

  9. electron 安装 base64

    1.安装这个:https://www.npmjs.com/package/js-base64 2.安装ts:https://www.npmjs.com/package/@types/js-base64

  10. 《Learning from Context or Names?An Empirical Study on Neural Relation Extraction》论文阅读笔记

    代码 原文地址 预备知识: 1.什么是对比学习? 对比学习是一种机器学习范例,将未标记的数据点相互并列,以教导模型哪些点相似,哪些点不同. 也就是说,顾名思义,样本相互对比,属于同一分布的样本在嵌入空 ...