RocketMQ 原理:消息存储、高可用、消息重试、消息幂等性
消息存储
消息存储方式
非持久化

消息生成者发送消息到 MQ
MQ 返回 ACK(Acknowledge Character)给生产者
MQ push 消息给对应的消费者
消息消费者返回 ACK 给 MQ
持久化

消息生成者发送消息到 MQ
MQ 收到消息,将消息进行持久化,存储该消息
MQ 返回 ACK 给生产者
MQ push 消息给对应的消费者
消息消费者返回 ACK 给 MQ
MQ 删除消息
注意:
①第 5 步 MQ 在指定时间内接到消息消费者返回 ACK,MQ 认定消息消费成功,执行 6 。
②第 5 步 MQ 在指定时间内未接到消息消费者返回 ACK,MQ 认定消息消费失败,重新执行 4、5、6 。
消息存储介质

数据库
实现:ActiveMQ
缺点:数据库瓶颈将成为 MQ 瓶颈
文件系统
实现:RocketMQ/Kafka/RabbitMQ
解决方案:采用消息刷盘机制进行数据存储
缺点:硬盘损坏的问题无法避免
消息存储与读写方式
SSD(Solid State Disk):固态硬盘
随机写(100 KB/s)
顺序写(600 MB/s):1秒1部电影
Linux 系统发送数据的方式
- “零拷贝”技术
- 数据传输由传统的 4 次复制简化成 3 次复制,减少 1 次复制过程
- Java 语言中使用 MappedByteBuffer 类实现了该技术
- 要求:预留存储空间,用于保存数据(1G 存储空间起步)

消息存储结构

如图所示,MQ 数据存储区域包含如下内容:
- 消息数据存储区域
- topic
- queueId
- message
- 消费逻辑队列
- minOffset
- maxOffset
- consumerOffset
- 索引
- key 索引
- 创建时间索引
- ……
刷盘机制
同步刷盘

生产者发送消息到 MQ,MQ 接到消息数据
MQ 挂起生产者发送消息的线程
MQ 将消息数据写入内存
内存数据写入硬盘
磁盘存储后返回 SUCCESS
MQ 恢复挂起的生产者线程
发送 ACK 到生产者
异步刷盘

生产者发送消息到 MQ,MQ 接到消息数据
MQ 将消息数据写入内存
发送 ACK 到生产者
小结
- 同步刷盘:安全性高,效率低,速度慢(适用于对数据安全要求较高的业务)
- 异步刷盘:安全性低,效率高,速度快(适用于对数据处理速度要求较高的业务)
# 刷盘方式
#- ASYNC_FLUSH 异步刷盘
#- SYNC_FLUSH 同步刷盘
flushDiskType=SYNC_FLUSH
高可用
高可用实现
nameserver
- 无状态 + 全服务器注册
消息服务器
- 主从架构(2M-2S)
消息生产
- 生产者将相同的 topic 绑定到多个 group 组,保证即使 broker master 挂掉,其他 master 仍可正常进行消息接收。
消息消费
- RocketMQ 自身会根据 broker master 的压力确认是否由 master 承担消息读取的功能,当 master 繁忙时候,自动切换由 slave 承担数据读取的工作。
主从复制
同步复制:
- master 接到消息后,先复制到 slave,然后反馈给生产者写操作成功
- 优点:数据安全,不丢数据,出现故障容易恢复
- 缺点:影响数据吞吐量,整体性能低
异步复制:
- master 接到消息后,立即返回给生产者写操作成功,当消息达到一定量后再异步复制到slave
- 优点:数据吞吐量大,操作延迟低,性能高
- 缺点:数据不安全,会出现数据丢失的现象,一旦 master 出现故障,从上次数据同步到故障时间的数据将丢失
配置方式:
#Broker 的角色
#- ASYNC_MASTER 异步复制Master
#- SYNC_MASTER 同步双写Master
#- SLAVE
brokerRole=SYNC_MASTER
负载均衡
Producer 负载均衡:
- 内部实现了不同 broker 集群中对同一 topic 对应消息队列的负载均衡
Consumer 两种负载均衡策略:
平均分配

循环平均分配

消息重试
当消息消费后未正常返回消费成功的信息将启动消息重试机制
两种消息重试机制:
顺序消息重试
无序消息重试
顺序消息重试
- 当消费者消费消息失败后,RocketMQ 会自动进行消息重试(每次间隔时间为 1 秒)。
- 注意:应用会出现消息消费被阻塞的情况,因此,要对顺序消息的消费情况进行监控,避免阻塞现象的发生。

无序消息重试
- 无序消息包括普通消息、定时消息、延时消息、事务消息。
- 无序消息重试仅适用于负载均衡(集群)模型下的消息消费,不适用于广播模式下的消息消费。
- 为保障无序消息的消费,MQ 设定了合理的消息重试间隔时长。

死信队列
概念:
当消息消费重试到达了指定次数(默认 16 次)后,MQ 将无法被正常消费的消息称为死信消息(Dead-Letter Message)。
死信消息不会被直接抛弃,而是保存到了一个全新的队列中,该队列称为死信队列(Dead-Letter Queue)。
死信队列的特征:
- 归属某一个组(Gourp Id),而不归属 Topic,也不归属消费者。
- 一个死信队列中可以包含同一个组下的多个 Topic 中的死信消息。
- 死信队列不会进行默认初始化,当第一个死信出现后,此队列首次初始化。
死信队列中的消息的特征:
- 不会被再次重复消费。
- 死信队列中的消息有效期为 3 天,达到时限后将被清除。
死信处理:
- 在监控平台中,通过查找死信,获取死信的 messageId,然后通过 id 对死信进行精准消费。
消息幂等
消息重复消费
消息重复消费原因:
- 生产者发送了重复的消息
- 网络闪断
- 生产者宕机
- 消息服务器投递了重复的消息
- 网络闪断
- 动态的负载均衡过程
- 网络闪断/抖动
- broker重启
- 订阅方应用重启(消费者)
- 客户端扩容
- 客户端缩容

消息幂等
对同一条消息,无论消费多少次,结果保持一致,称为消息幂等性。
解决方案:
使用业务 id 作为消息的 key 。
在消费消息时,客户端对 key 做判定,未使用过放行,使用过抛弃。
- 注意:messageId 由 RocketMQ 产生,messageId 并不具有唯一性,不能作用幂等判定条件。
常见的幂等方法示例:
- 新增(不幂等):insert into order values(……)
- 查询(幂等)
- 删除(幂等):delete from 表 where id=1
- 修改(不幂等):update account set balance = balance+100 where no=1
- 修改(幂等):update account set balance = 100 where no=1
RocketMQ 原理:消息存储、高可用、消息重试、消息幂等性的更多相关文章
- Kafka、ActiveMQ、RabbitMQ、RocketMQ 区别以及高可用原理
为什么使用消息队列 其实就是问问你消息队列都有哪些使用场景,然后你项目里具体是什么场景,说说你在这个场景里用消息队列是什么? 面试官问你这个问题,期望的一个回答是说,你们公司有个什么业务场景,这个业务 ...
- MongoDB分片技术原理和高可用集群配置方案
一.Sharding分片技术 1.分片概述 当数据量比较大的时候,我们需要把数分片运行在不同的机器中,以降低CPU.内存和Io的压力,Sharding就是数据库分片技术. MongoDB分片技术类似M ...
- rocketmq总结(消息的高可用、中间件选型)
rocketmq总结(消息的高可用.中间件选型) 参考: https://blog.csdn.net/meilong_whpu/article/details/76922456 http://blog ...
- RocketMQ源码详解 | Broker篇 · 其五:高可用之主从架构
概述 对于一个消息中间件来讲,高可用功能是极其重要的,RocketMQ 当然也具有其对应的高可用方案. 在 RocketMQ 中,有主从架构和 Dledger 两种高可用方案: 第一种通过主 Brok ...
- HBase高可用原理与实践
前言 前段时间有套线上HBase出了点小问题,导致该套HBase集群服务停止了2个小时,从而造成使用该套HBase作为数据存储的应用也出现了服务异常.在排查问题之余,我们不禁也在思考,以后再出现类似的 ...
- 一套高可用、易伸缩、高并发的IM群聊架构方案设计实践
本文原题为“一套高可用群聊消息系统实现”,由作者“于雨氏”授权整理和发布,内容有些许改动,作者博客地址:alexstocks.github.io.应作者要求,如需转载,请联系作者获得授权. 一.引言 ...
- EQueue 2.3.2版本发布(支持高可用)
前言 前段时间针对EQueue的完善终于告一段落了,实在值得庆祝,自己的付出和坚持总算有了成果.这次新版本主要为EQueue实现了集群功能,基本实现了Broker的高可用.另外还增加了很多实用的功能, ...
- keepalived高可用简介与配置
keepalived简介 keepalived介绍 Keepalived 软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP ...
- 高可用系列之Nginx
1.1Keepalived高可用软件 Keepalived起初是专为LVS设计的,专门用来监控LVS集群系统中各个服务节点的状态,后来又加入了VRRP的功能,因此除了配合LVS服务外,也可以作为其他服 ...
- keepalived+nginx负载均衡+ApacheWeb实现高可用
1.Keepalived高可用软件 Keepalived软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP功能.因此,kee ...
随机推荐
- Landsat 现有 Analysis Ready Data (ARD) 数据介绍
Global Web-Enabled Landsat Data (GWELD)[1] NASA 原先的 Web-Enabled Landsat Data Conterminous U.S. Seaso ...
- ACwing1212. 地宫取宝
题目: X 国王有一个地宫宝库,是 n×m 个格子的矩阵,每个格子放一件宝贝,每个宝贝贴着价值标签. 地宫的入口在左上角,出口在右下角. 小明被带到地宫的入口,国王要求他只能向右或向下行走. 走过某个 ...
- git提交忽略文件.gitignore内容
###################################################################### # Build Tools .gradle /build/ ...
- MySQL查找数据中相同的数据,并进行删除
查找表中多余的重复记录,重复记录是根据某个字段来判断 select * from 表名 where 字段 in (select 字段 from 表名 group by 字段 having count( ...
- Android Linux vmstat 命令详解
vmstat命令是最常见的Linux/Unix监控工具,可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率,内存使用,虚拟内存交换情况,IO读写情况.这个命令是我查看Linux/Unix最 ...
- 【LeetCode】1002. Find Common Characters 解题报告(Python)
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 字典 日期 题目地址:https://leetcod ...
- 1091. Tmutarakan Exams
1091. Tmutarakan Exams Time limit: 1.0 secondMemory limit: 64 MB University of New Tmutarakan trains ...
- 警惕!PHP、Node、Ruby 和 Python 应用,漏洞还没结束!
12 月 10 日凌晨,Apache 开源项目 Log4j2 的远程代码执行漏洞细节被公开,作为当前全球使用最广泛的 java 日志框架之一.该漏洞影响着很多全球使用量前列的开源组件,如 Apache ...
- Generating Adversarial Examples with Adversarial Networks
目录 概 主要内容 black-box 拓展 Xiao C, Li B, Zhu J, et al. Generating Adversarial Examples with Adversarial ...
- html+css+JavaScript实现爱恩斯坦棋游戏
title: "html+css+JavaScript实现爱恩斯坦棋游戏" author: Sun-Wind date: December 30, 2021 背景:本贴将基于前端的 ...