RocketMQ 原理:消息存储、高可用、消息重试、消息幂等性
消息存储
消息存储方式
非持久化

消息生成者发送消息到 MQ
MQ 返回 ACK(Acknowledge Character)给生产者
MQ push 消息给对应的消费者
消息消费者返回 ACK 给 MQ
持久化

消息生成者发送消息到 MQ
MQ 收到消息,将消息进行持久化,存储该消息
MQ 返回 ACK 给生产者
MQ push 消息给对应的消费者
消息消费者返回 ACK 给 MQ
MQ 删除消息
注意:
①第 5 步 MQ 在指定时间内接到消息消费者返回 ACK,MQ 认定消息消费成功,执行 6 。
②第 5 步 MQ 在指定时间内未接到消息消费者返回 ACK,MQ 认定消息消费失败,重新执行 4、5、6 。
消息存储介质

数据库
实现:ActiveMQ
缺点:数据库瓶颈将成为 MQ 瓶颈
文件系统
实现:RocketMQ/Kafka/RabbitMQ
解决方案:采用消息刷盘机制进行数据存储
缺点:硬盘损坏的问题无法避免
消息存储与读写方式
SSD(Solid State Disk):固态硬盘
随机写(100 KB/s)
顺序写(600 MB/s):1秒1部电影
Linux 系统发送数据的方式
- “零拷贝”技术
- 数据传输由传统的 4 次复制简化成 3 次复制,减少 1 次复制过程
- Java 语言中使用 MappedByteBuffer 类实现了该技术
- 要求:预留存储空间,用于保存数据(1G 存储空间起步)

消息存储结构

如图所示,MQ 数据存储区域包含如下内容:
- 消息数据存储区域
- topic
- queueId
- message
- 消费逻辑队列
- minOffset
- maxOffset
- consumerOffset
- 索引
- key 索引
- 创建时间索引
- ……
刷盘机制
同步刷盘

生产者发送消息到 MQ,MQ 接到消息数据
MQ 挂起生产者发送消息的线程
MQ 将消息数据写入内存
内存数据写入硬盘
磁盘存储后返回 SUCCESS
MQ 恢复挂起的生产者线程
发送 ACK 到生产者
异步刷盘

生产者发送消息到 MQ,MQ 接到消息数据
MQ 将消息数据写入内存
发送 ACK 到生产者
小结
- 同步刷盘:安全性高,效率低,速度慢(适用于对数据安全要求较高的业务)
- 异步刷盘:安全性低,效率高,速度快(适用于对数据处理速度要求较高的业务)
# 刷盘方式
#- ASYNC_FLUSH 异步刷盘
#- SYNC_FLUSH 同步刷盘
flushDiskType=SYNC_FLUSH
高可用
高可用实现
nameserver
- 无状态 + 全服务器注册
消息服务器
- 主从架构(2M-2S)
消息生产
- 生产者将相同的 topic 绑定到多个 group 组,保证即使 broker master 挂掉,其他 master 仍可正常进行消息接收。
消息消费
- RocketMQ 自身会根据 broker master 的压力确认是否由 master 承担消息读取的功能,当 master 繁忙时候,自动切换由 slave 承担数据读取的工作。
主从复制
同步复制:
- master 接到消息后,先复制到 slave,然后反馈给生产者写操作成功
- 优点:数据安全,不丢数据,出现故障容易恢复
- 缺点:影响数据吞吐量,整体性能低
异步复制:
- master 接到消息后,立即返回给生产者写操作成功,当消息达到一定量后再异步复制到slave
- 优点:数据吞吐量大,操作延迟低,性能高
- 缺点:数据不安全,会出现数据丢失的现象,一旦 master 出现故障,从上次数据同步到故障时间的数据将丢失
配置方式:
#Broker 的角色
#- ASYNC_MASTER 异步复制Master
#- SYNC_MASTER 同步双写Master
#- SLAVE
brokerRole=SYNC_MASTER
负载均衡
Producer 负载均衡:
- 内部实现了不同 broker 集群中对同一 topic 对应消息队列的负载均衡
Consumer 两种负载均衡策略:
平均分配

循环平均分配

消息重试
当消息消费后未正常返回消费成功的信息将启动消息重试机制
两种消息重试机制:
顺序消息重试
无序消息重试
顺序消息重试
- 当消费者消费消息失败后,RocketMQ 会自动进行消息重试(每次间隔时间为 1 秒)。
- 注意:应用会出现消息消费被阻塞的情况,因此,要对顺序消息的消费情况进行监控,避免阻塞现象的发生。

无序消息重试
- 无序消息包括普通消息、定时消息、延时消息、事务消息。
- 无序消息重试仅适用于负载均衡(集群)模型下的消息消费,不适用于广播模式下的消息消费。
- 为保障无序消息的消费,MQ 设定了合理的消息重试间隔时长。

死信队列
概念:
当消息消费重试到达了指定次数(默认 16 次)后,MQ 将无法被正常消费的消息称为死信消息(Dead-Letter Message)。
死信消息不会被直接抛弃,而是保存到了一个全新的队列中,该队列称为死信队列(Dead-Letter Queue)。
死信队列的特征:
- 归属某一个组(Gourp Id),而不归属 Topic,也不归属消费者。
- 一个死信队列中可以包含同一个组下的多个 Topic 中的死信消息。
- 死信队列不会进行默认初始化,当第一个死信出现后,此队列首次初始化。
死信队列中的消息的特征:
- 不会被再次重复消费。
- 死信队列中的消息有效期为 3 天,达到时限后将被清除。
死信处理:
- 在监控平台中,通过查找死信,获取死信的 messageId,然后通过 id 对死信进行精准消费。
消息幂等
消息重复消费
消息重复消费原因:
- 生产者发送了重复的消息
- 网络闪断
- 生产者宕机
- 消息服务器投递了重复的消息
- 网络闪断
- 动态的负载均衡过程
- 网络闪断/抖动
- broker重启
- 订阅方应用重启(消费者)
- 客户端扩容
- 客户端缩容

消息幂等
对同一条消息,无论消费多少次,结果保持一致,称为消息幂等性。
解决方案:
使用业务 id 作为消息的 key 。
在消费消息时,客户端对 key 做判定,未使用过放行,使用过抛弃。
- 注意:messageId 由 RocketMQ 产生,messageId 并不具有唯一性,不能作用幂等判定条件。
常见的幂等方法示例:
- 新增(不幂等):insert into order values(……)
- 查询(幂等)
- 删除(幂等):delete from 表 where id=1
- 修改(不幂等):update account set balance = balance+100 where no=1
- 修改(幂等):update account set balance = 100 where no=1
RocketMQ 原理:消息存储、高可用、消息重试、消息幂等性的更多相关文章
- Kafka、ActiveMQ、RabbitMQ、RocketMQ 区别以及高可用原理
为什么使用消息队列 其实就是问问你消息队列都有哪些使用场景,然后你项目里具体是什么场景,说说你在这个场景里用消息队列是什么? 面试官问你这个问题,期望的一个回答是说,你们公司有个什么业务场景,这个业务 ...
- MongoDB分片技术原理和高可用集群配置方案
一.Sharding分片技术 1.分片概述 当数据量比较大的时候,我们需要把数分片运行在不同的机器中,以降低CPU.内存和Io的压力,Sharding就是数据库分片技术. MongoDB分片技术类似M ...
- rocketmq总结(消息的高可用、中间件选型)
rocketmq总结(消息的高可用.中间件选型) 参考: https://blog.csdn.net/meilong_whpu/article/details/76922456 http://blog ...
- RocketMQ源码详解 | Broker篇 · 其五:高可用之主从架构
概述 对于一个消息中间件来讲,高可用功能是极其重要的,RocketMQ 当然也具有其对应的高可用方案. 在 RocketMQ 中,有主从架构和 Dledger 两种高可用方案: 第一种通过主 Brok ...
- HBase高可用原理与实践
前言 前段时间有套线上HBase出了点小问题,导致该套HBase集群服务停止了2个小时,从而造成使用该套HBase作为数据存储的应用也出现了服务异常.在排查问题之余,我们不禁也在思考,以后再出现类似的 ...
- 一套高可用、易伸缩、高并发的IM群聊架构方案设计实践
本文原题为“一套高可用群聊消息系统实现”,由作者“于雨氏”授权整理和发布,内容有些许改动,作者博客地址:alexstocks.github.io.应作者要求,如需转载,请联系作者获得授权. 一.引言 ...
- EQueue 2.3.2版本发布(支持高可用)
前言 前段时间针对EQueue的完善终于告一段落了,实在值得庆祝,自己的付出和坚持总算有了成果.这次新版本主要为EQueue实现了集群功能,基本实现了Broker的高可用.另外还增加了很多实用的功能, ...
- keepalived高可用简介与配置
keepalived简介 keepalived介绍 Keepalived 软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP ...
- 高可用系列之Nginx
1.1Keepalived高可用软件 Keepalived起初是专为LVS设计的,专门用来监控LVS集群系统中各个服务节点的状态,后来又加入了VRRP的功能,因此除了配合LVS服务外,也可以作为其他服 ...
- keepalived+nginx负载均衡+ApacheWeb实现高可用
1.Keepalived高可用软件 Keepalived软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP功能.因此,kee ...
随机推荐
- 主要视图展示(Project)
<Project2016 企业项目管理实践>张会斌 董方好 编著 有同学拿Excel做甘特图的(咳咳,我也做过),这行为,其实目的就是为了--消食-- 好吧,也是为了学习Excel中图表或 ...
- 成本计算?(Project)
<Project2016 企业项目管理实践>张会斌 董方好 编著 成本各种输入以后就该计算了是吗? 其实,计算有我什么事啊,不都是些四则运算吗?Project要是连这都搞不定,他还在地球上 ...
- .NET6中一些常用组件的配置及使用记录,持续更新中。。。
NET6App 介绍 .NET 6的CoreApp框架,用来学习.NET6的一些变动和新特性,使用EFCore,等一系列组件的运用,每个用单独的文档篇章记录,持续更新文档哦. 如果对您有帮助,点击右上 ...
- CF116B Little Pigs and Wolves 题解
Content 有一张 \(n\times m\) 的地图,其中,\(\texttt{P}\) 代表小猪,\(\texttt{W}\) 代表狼.如果狼的上下左右有一头以上的小猪,那么它会吃掉其中相邻的 ...
- LuoguP7259 [COCI2009-2010#3] SORT 题解
Content 请编写一个"频率排序器".输入一个 长度为 \(n\) 的数列 \(A=\{a_1,a_2,\dots,a_n\}\),要求: 按照每个数的出现次数降序排列. 如果 ...
- 请注意JS方法,方法同名,参数个数不一样是不能区分方法的,
请注意JS方法,方法同名,参数个数不一样是不能区分方法的, 所以要区分方法,只能利用方法名不同来区分,而不能利用参数个数与参数类型来分.
- flink使用命令开始、停止任务
命令操作 进行flink的安装目录 动态上传jar包启动job ./bin/flink run -c com.test.CountMain -P 3 Test-1. 0-SNAPSHOT.jar -- ...
- JAVA工具类获取HttpServletRequest、HttpServletResponse 对象
添加依赖 <!-- Spring Web --> <dependency> <groupId>org.springframework</groupId> ...
- TGAN
目录 概 主要内容 Saito M., Matsumoto E. & Saito S. Temporal Generative Adversarial Nets with Singular V ...
- NFS 部署
目录 NFS 部署 NFS简介 NFS应用 NFS工作流程图 NFS部署 服务端 客户端 测试NFS文件同步功能 NFS配置详解 NFS部分参数案例 统一用户 搭建考试系统 搭建步骤 配合NFS实现文 ...