RocketMQ 原理:消息存储、高可用、消息重试、消息幂等性
消息存储
消息存储方式
非持久化
消息生成者发送消息到 MQ
MQ 返回 ACK(Acknowledge Character)给生产者
MQ push 消息给对应的消费者
消息消费者返回 ACK 给 MQ
持久化
消息生成者发送消息到 MQ
MQ 收到消息,将消息进行持久化,存储该消息
MQ 返回 ACK 给生产者
MQ push 消息给对应的消费者
消息消费者返回 ACK 给 MQ
MQ 删除消息
注意:
①第 5 步 MQ 在指定时间内接到消息消费者返回 ACK,MQ 认定消息消费成功,执行 6 。
②第 5 步 MQ 在指定时间内未接到消息消费者返回 ACK,MQ 认定消息消费失败,重新执行 4、5、6 。
消息存储介质
数据库
实现:ActiveMQ
缺点:数据库瓶颈将成为 MQ 瓶颈
文件系统
实现:RocketMQ/Kafka/RabbitMQ
解决方案:采用消息刷盘机制进行数据存储
缺点:硬盘损坏的问题无法避免
消息存储与读写方式
SSD(Solid State Disk):固态硬盘
随机写(100 KB/s)
顺序写(600 MB/s):1秒1部电影
Linux 系统发送数据的方式
- “零拷贝”技术
- 数据传输由传统的 4 次复制简化成 3 次复制,减少 1 次复制过程
- Java 语言中使用 MappedByteBuffer 类实现了该技术
- 要求:预留存储空间,用于保存数据(1G 存储空间起步)
消息存储结构
如图所示,MQ 数据存储区域包含如下内容:
- 消息数据存储区域
- topic
- queueId
- message
- 消费逻辑队列
- minOffset
- maxOffset
- consumerOffset
- 索引
- key 索引
- 创建时间索引
- ……
刷盘机制
同步刷盘
生产者发送消息到 MQ,MQ 接到消息数据
MQ 挂起生产者发送消息的线程
MQ 将消息数据写入内存
内存数据写入硬盘
磁盘存储后返回 SUCCESS
MQ 恢复挂起的生产者线程
发送 ACK 到生产者
异步刷盘
生产者发送消息到 MQ,MQ 接到消息数据
MQ 将消息数据写入内存
发送 ACK 到生产者
小结
- 同步刷盘:安全性高,效率低,速度慢(适用于对数据安全要求较高的业务)
- 异步刷盘:安全性低,效率高,速度快(适用于对数据处理速度要求较高的业务)
# 刷盘方式
#- ASYNC_FLUSH 异步刷盘
#- SYNC_FLUSH 同步刷盘
flushDiskType=SYNC_FLUSH
高可用
高可用实现
nameserver
- 无状态 + 全服务器注册
消息服务器
- 主从架构(2M-2S)
消息生产
- 生产者将相同的 topic 绑定到多个 group 组,保证即使 broker master 挂掉,其他 master 仍可正常进行消息接收。
消息消费
- RocketMQ 自身会根据 broker master 的压力确认是否由 master 承担消息读取的功能,当 master 繁忙时候,自动切换由 slave 承担数据读取的工作。
主从复制
同步复制:
- master 接到消息后,先复制到 slave,然后反馈给生产者写操作成功
- 优点:数据安全,不丢数据,出现故障容易恢复
- 缺点:影响数据吞吐量,整体性能低
异步复制:
- master 接到消息后,立即返回给生产者写操作成功,当消息达到一定量后再异步复制到slave
- 优点:数据吞吐量大,操作延迟低,性能高
- 缺点:数据不安全,会出现数据丢失的现象,一旦 master 出现故障,从上次数据同步到故障时间的数据将丢失
配置方式:
#Broker 的角色
#- ASYNC_MASTER 异步复制Master
#- SYNC_MASTER 同步双写Master
#- SLAVE
brokerRole=SYNC_MASTER
负载均衡
Producer 负载均衡:
- 内部实现了不同 broker 集群中对同一 topic 对应消息队列的负载均衡
Consumer 两种负载均衡策略:
平均分配
循环平均分配
消息重试
当消息消费后未正常返回消费成功的信息将启动消息重试机制
两种消息重试机制:
顺序消息重试
无序消息重试
顺序消息重试
- 当消费者消费消息失败后,RocketMQ 会自动进行消息重试(每次间隔时间为 1 秒)。
- 注意:应用会出现消息消费被阻塞的情况,因此,要对顺序消息的消费情况进行监控,避免阻塞现象的发生。
无序消息重试
- 无序消息包括普通消息、定时消息、延时消息、事务消息。
- 无序消息重试仅适用于负载均衡(集群)模型下的消息消费,不适用于广播模式下的消息消费。
- 为保障无序消息的消费,MQ 设定了合理的消息重试间隔时长。
死信队列
概念:
当消息消费重试到达了指定次数(默认 16 次)后,MQ 将无法被正常消费的消息称为死信消息(Dead-Letter Message)。
死信消息不会被直接抛弃,而是保存到了一个全新的队列中,该队列称为死信队列(Dead-Letter Queue)。
死信队列的特征:
- 归属某一个组(Gourp Id),而不归属 Topic,也不归属消费者。
- 一个死信队列中可以包含同一个组下的多个 Topic 中的死信消息。
- 死信队列不会进行默认初始化,当第一个死信出现后,此队列首次初始化。
死信队列中的消息的特征:
- 不会被再次重复消费。
- 死信队列中的消息有效期为 3 天,达到时限后将被清除。
死信处理:
- 在监控平台中,通过查找死信,获取死信的 messageId,然后通过 id 对死信进行精准消费。
消息幂等
消息重复消费
消息重复消费原因:
- 生产者发送了重复的消息
- 网络闪断
- 生产者宕机
- 消息服务器投递了重复的消息
- 网络闪断
- 动态的负载均衡过程
- 网络闪断/抖动
- broker重启
- 订阅方应用重启(消费者)
- 客户端扩容
- 客户端缩容
消息幂等
对同一条消息,无论消费多少次,结果保持一致,称为消息幂等性。
解决方案:
使用业务 id 作为消息的 key 。
在消费消息时,客户端对 key 做判定,未使用过放行,使用过抛弃。
- 注意:messageId 由 RocketMQ 产生,messageId 并不具有唯一性,不能作用幂等判定条件。
常见的幂等方法示例:
- 新增(不幂等):insert into order values(……)
- 查询(幂等)
- 删除(幂等):delete from 表 where id=1
- 修改(不幂等):update account set balance = balance+100 where no=1
- 修改(幂等):update account set balance = 100 where no=1
RocketMQ 原理:消息存储、高可用、消息重试、消息幂等性的更多相关文章
- Kafka、ActiveMQ、RabbitMQ、RocketMQ 区别以及高可用原理
为什么使用消息队列 其实就是问问你消息队列都有哪些使用场景,然后你项目里具体是什么场景,说说你在这个场景里用消息队列是什么? 面试官问你这个问题,期望的一个回答是说,你们公司有个什么业务场景,这个业务 ...
- MongoDB分片技术原理和高可用集群配置方案
一.Sharding分片技术 1.分片概述 当数据量比较大的时候,我们需要把数分片运行在不同的机器中,以降低CPU.内存和Io的压力,Sharding就是数据库分片技术. MongoDB分片技术类似M ...
- rocketmq总结(消息的高可用、中间件选型)
rocketmq总结(消息的高可用.中间件选型) 参考: https://blog.csdn.net/meilong_whpu/article/details/76922456 http://blog ...
- RocketMQ源码详解 | Broker篇 · 其五:高可用之主从架构
概述 对于一个消息中间件来讲,高可用功能是极其重要的,RocketMQ 当然也具有其对应的高可用方案. 在 RocketMQ 中,有主从架构和 Dledger 两种高可用方案: 第一种通过主 Brok ...
- HBase高可用原理与实践
前言 前段时间有套线上HBase出了点小问题,导致该套HBase集群服务停止了2个小时,从而造成使用该套HBase作为数据存储的应用也出现了服务异常.在排查问题之余,我们不禁也在思考,以后再出现类似的 ...
- 一套高可用、易伸缩、高并发的IM群聊架构方案设计实践
本文原题为“一套高可用群聊消息系统实现”,由作者“于雨氏”授权整理和发布,内容有些许改动,作者博客地址:alexstocks.github.io.应作者要求,如需转载,请联系作者获得授权. 一.引言 ...
- EQueue 2.3.2版本发布(支持高可用)
前言 前段时间针对EQueue的完善终于告一段落了,实在值得庆祝,自己的付出和坚持总算有了成果.这次新版本主要为EQueue实现了集群功能,基本实现了Broker的高可用.另外还增加了很多实用的功能, ...
- keepalived高可用简介与配置
keepalived简介 keepalived介绍 Keepalived 软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP ...
- 高可用系列之Nginx
1.1Keepalived高可用软件 Keepalived起初是专为LVS设计的,专门用来监控LVS集群系统中各个服务节点的状态,后来又加入了VRRP的功能,因此除了配合LVS服务外,也可以作为其他服 ...
- keepalived+nginx负载均衡+ApacheWeb实现高可用
1.Keepalived高可用软件 Keepalived软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP功能.因此,kee ...
随机推荐
- Docker从入门到精通(七)——容器数据共享
什么是容器数据共享?简单来说就是容器与容器之间数据共享,容器与宿主机数据共享. 1.为什么需要数据共享? ①.数据持久化 比如我们有一个MySQL集群,通过容器启动,那么项目运行过程中的数据是保存在容 ...
- CF792A New Bus Route 题解
Content 给定一个长度为 \(n\) 的数列 \(a_1,a_2,a_3,...,a_n\),求这个序列当中差的绝对值最小的数对并求出这样的数对的个数. 数据范围:\(2\leqslant n\ ...
- CF919B Perfect Number 题解
Content 给定一个数字 \(k\),求出第 \(k\) 小的各数位和为 \(10\) 的数. 数据范围:\(1\leqslant k\leqslant 10000\). Solution 这题为 ...
- CF450B Jzzhu and Sequences 题解
Content 有一个长度为 \(n\) 的数列 \(\{a_1,a_2,\dots,a_n\}\),满足如下的递推公式: \(i=1\) 时,\(a_1=x\). \(i=2\) 时,\(a_2=y ...
- 多进程 multiprocessing 模块进程并发Process;Pool ;Queue队列 、threading模块;
multiprocessing 模块中的 Process类提供了跨平台的多进程功能,在windows和linux系统都可以使用. 1.首先要实例化一个类,传入要执行的函数. 实例名 = Process ...
- 关于Marshal 类的整理
在两个不同的实体(两个线程或者进程甚至机器.在Managed和Unmanaged之间)进行方法调用和参数传递的时候,具体的调用方法和参数的内存格式可能需要一定的转换,这个转换的过程叫做Marshal. ...
- restTemplate 接收list数据
User[] users= restTemplate.getForObject(url, User[].class); 使用数组接收
- JAVA获取多个经纬度的中心点
import java.util.LinkedList; public class Test1 { /** * 位置实体类,根据自己的来即可 */ static class Position{ /** ...
- MySQL高级查询与编程笔记 • 【第5章 常见数据库对象】
全部章节 >>>> 本章目录 5.1 视图 5.1.1 视图的定义 5.1.2 视图的优点 5.1.3 视图的创建和使用 5.1.4 利用视图解决数据库的复杂应用 5.1. ...
- 编写Java程序,车站只剩 50 张从武汉到北京的车票,现有 3 个窗口售卖,用程序模拟售票的过程,使用Runnable解决线程安全问题
查看本章节 查看作业目录 需求说明: 车站只剩 50 张从武汉到北京的车票,现有 3 个窗口售卖,用程序模拟售票的过程,要求使用同步方法保证售票过程中票数的正确性 实现思路: 创建 Java 项目,在 ...