消息存储

消息存储方式

非持久化

消息生成者发送消息到 MQ
MQ 返回 ACK（Acknowledge Character）给生产者
MQ push 消息给对应的消费者
消息消费者返回 ACK 给 MQ

持久化

消息生成者发送消息到 MQ
MQ 收到消息，将消息进行持久化，存储该消息
MQ 返回 ACK 给生产者
MQ push 消息给对应的消费者
消息消费者返回 ACK 给 MQ
MQ 删除消息

注意：

①第 5 步 MQ 在指定时间内接到消息消费者返回 ACK，MQ 认定消息消费成功，执行 6 。

②第 5 步 MQ 在指定时间内未接到消息消费者返回 ACK，MQ 认定消息消费失败，重新执行 4、5、6 。

消息存储介质

数据库

实现：ActiveMQ
缺点：数据库瓶颈将成为 MQ 瓶颈

文件系统

实现：RocketMQ/Kafka/RabbitMQ
解决方案：采用消息刷盘机制进行数据存储
缺点：硬盘损坏的问题无法避免

消息存储与读写方式

SSD（Solid State Disk）：固态硬盘

随机写（100 KB/s）
顺序写（600 MB/s）：1秒1部电影

Linux 系统发送数据的方式

“零拷贝”技术
- 数据传输由传统的 4 次复制简化成 3 次复制，减少 1 次复制过程
- Java 语言中使用 MappedByteBuffer 类实现了该技术
- 要求：预留存储空间，用于保存数据（1G 存储空间起步）

消息存储结构

如图所示，MQ 数据存储区域包含如下内容：

消息数据存储区域
- topic
- queueId
- message
消费逻辑队列
- minOffset
- maxOffset
- consumerOffset
索引
- key 索引
- 创建时间索引
- ……

刷盘机制

同步刷盘

生产者发送消息到 MQ，MQ 接到消息数据
MQ 挂起生产者发送消息的线程
MQ 将消息数据写入内存
内存数据写入硬盘
磁盘存储后返回 SUCCESS
MQ 恢复挂起的生产者线程
发送 ACK 到生产者

异步刷盘

生产者发送消息到 MQ，MQ 接到消息数据
MQ 将消息数据写入内存
发送 ACK 到生产者

小结

同步刷盘：安全性高，效率低，速度慢（适用于对数据安全要求较高的业务）
异步刷盘：安全性低，效率高，速度快（适用于对数据处理速度要求较高的业务）

# 刷盘方式

#- ASYNC_FLUSH 异步刷盘

#- SYNC_FLUSH 同步刷盘

flushDiskType=SYNC_FLUSH

高可用

高可用实现

nameserver

无状态 + 全服务器注册

消息服务器

主从架构（2M-2S）

消息生产

生产者将相同的 topic 绑定到多个 group 组，保证即使 broker master 挂掉，其他 master 仍可正常进行消息接收。

消息消费

RocketMQ 自身会根据 broker master 的压力确认是否由 master 承担消息读取的功能，当 master 繁忙时候，自动切换由 slave 承担数据读取的工作。

主从复制

同步复制：

master 接到消息后，先复制到 slave，然后反馈给生产者写操作成功
优点：数据安全，不丢数据，出现故障容易恢复
缺点：影响数据吞吐量，整体性能低

异步复制：

master 接到消息后，立即返回给生产者写操作成功，当消息达到一定量后再异步复制到slave
优点：数据吞吐量大，操作延迟低，性能高
缺点：数据不安全，会出现数据丢失的现象，一旦 master 出现故障，从上次数据同步到故障时间的数据将丢失

配置方式：

#Broker 的角色

#- ASYNC_MASTER 异步复制Master

#- SYNC_MASTER 同步双写Master

#- SLAVE

brokerRole=SYNC_MASTER

负载均衡

Producer 负载均衡：

内部实现了不同 broker 集群中对同一 topic 对应消息队列的负载均衡

Consumer 两种负载均衡策略：

平均分配
循环平均分配

消息重试

当消息消费后未正常返回消费成功的信息将启动消息重试机制

两种消息重试机制：

顺序消息重试
无序消息重试

顺序消息重试

当消费者消费消息失败后，RocketMQ 会自动进行消息重试（每次间隔时间为 1 秒）。
注意：应用会出现消息消费被阻塞的情况，因此，要对顺序消息的消费情况进行监控，避免阻塞现象的发生。

无序消息重试

无序消息包括普通消息、定时消息、延时消息、事务消息。
无序消息重试仅适用于负载均衡（集群）模型下的消息消费，不适用于广播模式下的消息消费。
为保障无序消息的消费，MQ 设定了合理的消息重试间隔时长。

死信队列

概念：

当消息消费重试到达了指定次数（默认 16 次）后，MQ 将无法被正常消费的消息称为死信消息（Dead-Letter Message）。
死信消息不会被直接抛弃，而是保存到了一个全新的队列中，该队列称为死信队列（Dead-Letter Queue）。

死信队列的特征：

归属某一个组（Gourp Id），而不归属 Topic，也不归属消费者。
一个死信队列中可以包含同一个组下的多个 Topic 中的死信消息。
死信队列不会进行默认初始化，当第一个死信出现后，此队列首次初始化。

死信队列中的消息的特征：

不会被再次重复消费。
死信队列中的消息有效期为 3 天，达到时限后将被清除。

死信处理：

在监控平台中，通过查找死信，获取死信的 messageId，然后通过 id 对死信进行精准消费。

消息幂等

消息重复消费

消息重复消费原因：

生产者发送了重复的消息
- 网络闪断
- 生产者宕机
消息服务器投递了重复的消息
- 网络闪断
动态的负载均衡过程
- 网络闪断/抖动
- broker重启
- 订阅方应用重启（消费者）
- 客户端扩容
- 客户端缩容

消息幂等

对同一条消息，无论消费多少次，结果保持一致，称为消息幂等性。

解决方案：

使用业务 id 作为消息的 key 。
在消费消息时，客户端对 key 做判定，未使用过放行，使用过抛弃。

注意：messageId 由 RocketMQ 产生，messageId 并不具有唯一性，不能作用幂等判定条件。

常见的幂等方法示例：

新增（不幂等）：insert into order values(……)
查询（幂等）
删除（幂等）：delete from 表 where id=1
修改（不幂等）：update account set balance = balance+100 where no=1
修改（幂等）：update account set balance = 100 where no=1

RocketMQ 原理：消息存储、高可用、消息重试、消息幂等性的更多相关文章

Kafka、ActiveMQ、RabbitMQ、RocketMQ 区别以及高可用原理
为什么使用消息队列其实就是问问你消息队列都有哪些使用场景,然后你项目里具体是什么场景,说说你在这个场景里用消息队列是什么? 面试官问你这个问题,期望的一个回答是说,你们公司有个什么业务场景,这个业务 ...
MongoDB分片技术原理和高可用集群配置方案
一.Sharding分片技术 1.分片概述当数据量比较大的时候,我们需要把数分片运行在不同的机器中,以降低CPU.内存和Io的压力,Sharding就是数据库分片技术. MongoDB分片技术类似M ...
rocketmq总结(消息的高可用、中间件选型)
rocketmq总结(消息的高可用.中间件选型) 参考: https://blog.csdn.net/meilong_whpu/article/details/76922456 http://blog ...
RocketMQ源码详解 | Broker篇 · 其五：高可用之主从架构
概述对于一个消息中间件来讲,高可用功能是极其重要的,RocketMQ 当然也具有其对应的高可用方案. 在 RocketMQ 中,有主从架构和 Dledger 两种高可用方案: 第一种通过主 Brok ...
HBase高可用原理与实践
前言前段时间有套线上HBase出了点小问题,导致该套HBase集群服务停止了2个小时,从而造成使用该套HBase作为数据存储的应用也出现了服务异常.在排查问题之余,我们不禁也在思考,以后再出现类似的 ...
一套高可用、易伸缩、高并发的IM群聊架构方案设计实践
本文原题为“一套高可用群聊消息系统实现”,由作者“于雨氏”授权整理和发布,内容有些许改动,作者博客地址:alexstocks.github.io.应作者要求,如需转载,请联系作者获得授权. 一.引言 ...
EQueue 2.3.2版本发布（支持高可用）
前言前段时间针对EQueue的完善终于告一段落了,实在值得庆祝,自己的付出和坚持总算有了成果.这次新版本主要为EQueue实现了集群功能,基本实现了Broker的高可用.另外还增加了很多实用的功能, ...
keepalived高可用简介与配置
keepalived简介 keepalived介绍 Keepalived 软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP ...
高可用系列之Nginx
1.1Keepalived高可用软件 Keepalived起初是专为LVS设计的,专门用来监控LVS集群系统中各个服务节点的状态,后来又加入了VRRP的功能,因此除了配合LVS服务外,也可以作为其他服 ...
keepalived+nginx负载均衡+ApacheWeb实现高可用
1.Keepalived高可用软件 Keepalived软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP功能.因此,kee ...

随机推荐

主要视图展示（Project）
<Project2016 企业项目管理实践>张会斌董方好编著有同学拿Excel做甘特图的(咳咳,我也做过),这行为,其实目的就是为了--消食-- 好吧,也是为了学习Excel中图表或 ...
成本计算？（Project）
<Project2016 企业项目管理实践>张会斌董方好编著成本各种输入以后就该计算了是吗? 其实,计算有我什么事啊,不都是些四则运算吗?Project要是连这都搞不定,他还在地球上 ...
.NET6中一些常用组件的配置及使用记录，持续更新中。。。
NET6App 介绍 .NET 6的CoreApp框架,用来学习.NET6的一些变动和新特性,使用EFCore,等一系列组件的运用,每个用单独的文档篇章记录,持续更新文档哦. 如果对您有帮助,点击右上 ...
CF116B Little Pigs and Wolves 题解
Content 有一张 \(n\times m\) 的地图,其中,\(\texttt{P}\) 代表小猪,\(\texttt{W}\) 代表狼.如果狼的上下左右有一头以上的小猪,那么它会吃掉其中相邻的 ...
LuoguP7259 [COCI2009-2010#3] SORT 题解
Content 请编写一个"频率排序器".输入一个长度为 \(n\) 的数列 \(A=\{a_1,a_2,\dots,a_n\}\),要求: 按照每个数的出现次数降序排列. 如果 ...
请注意JS方法，方法同名，参数个数不一样是不能区分方法的，
请注意JS方法,方法同名,参数个数不一样是不能区分方法的, 所以要区分方法,只能利用方法名不同来区分,而不能利用参数个数与参数类型来分.
flink使用命令开始、停止任务
命令操作进行flink的安装目录动态上传jar包启动job ./bin/flink run -c com.test.CountMain -P 3 Test-1. 0-SNAPSHOT.jar -- ...
JAVA工具类获取HttpServletRequest、HttpServletResponse 对象
添加依赖  <dependency> <groupId>org.springframework</groupId> ...
TGAN
目录概主要内容 Saito M., Matsumoto E. & Saito S. Temporal Generative Adversarial Nets with Singular V ...
NFS 部署
目录 NFS 部署 NFS简介 NFS应用 NFS工作流程图 NFS部署服务端客户端测试NFS文件同步功能 NFS配置详解 NFS部分参数案例统一用户搭建考试系统搭建步骤配合NFS实现文 ...

RocketMQ 原理：消息存储、高可用、消息重试、消息幂等性

消息存储

消息存储方式

非持久化

持久化

消息存储介质

消息存储与读写方式

消息存储结构

刷盘机制

同步刷盘

异步刷盘

小结

高可用

高可用实现

主从复制

负载均衡

消息重试

顺序消息重试

无序消息重试

死信队列

消息幂等

消息重复消费

消息幂等

RocketMQ 原理：消息存储、高可用、消息重试、消息幂等性的更多相关文章

随机推荐

热门专题