MQ系列1：消息中间件执行原理

 MQ系列2：消息中间件的技术选型

 MQ系列3：RocketMQ 架构分析

 MQ系列4：NameServer 原理解析

 MQ系列5：RocketMQ消息的发送模式

 MQ系列6：消息的消费

 MQ系列7：消息通信，追求极致性能

1 介绍

在之前的章节中，我们介绍了消息的发送和消息通信的原理。但是这边有一个比较核心的关键点，那就是如果已经把消息传递给Broker。在Broker在被消费之前，如何保证消息的稳定性，避免消息丢失和数据。

这时候就需要数据持久化数据来进行保障了。

根据之前我们 MQ系列2：消息中间件的技术选型章节做的分析，RabbitMQ支持 1W+ 级别的吞吐，

Kafka 和 Rocket 支持 10W+ 级别的吞吐，想要实现这么大的吞吐，必须具备一个很强悍的存储功能。下面我们来看看。

2 Broker 存储架构

RocketMQ采用文件存储机制（类似Kafka），即直接在磁盘上使用文件来保存消息，而不是采用Redis或者MySQL之类的持久化工具。

它会把消息存储所属相关的文件存储在ROCKETMQ_HOME下，包含三个部分：

2.1 CommitLog 消息元数据

存储消息的元数据，所有消息都会顺序存入到CommitLog文件中。CommitLog由多个文件组成，每个文件固定大小1G。它有如下特征：

单个文件默认大小为1G
文件名称长度20，保存偏移量，偏移量不够20位的补0。
- 如第1个文件没有偏移量，则为：00000000000000000000
- 第2个文件起始偏移量为1073741824（1G=1073740842），则文件名为 00000000001073741824。
第一个1G文件文件写满之后之后转入第2个文件，如此反复，因为是顺序的，所以写入效率较高。

2.2 ConsumeQueue 消息逻辑队列

ConsumeQueue是指存储消息在CommitLog上的索引，一个MessageQueue一个文件，记录当前MessageQueue被哪些消费者组消费到了哪一条CommitLog。它有如下特征：

ComsumeQueue的结构组成共 20 个字节，包含 8 字节的 commitlog 物理偏移量、4 字节的消息长度、8 字节 tag hashcode
ConsumeQueue 里只存偏移量信息，内容精悍。加载到内存中，操作效率非常高。
一致性保障，CommitLog 里存储了 ConsumeQueues、Message Key、Tag 等所有信息，在 ConsumeQueue 丢失或者故障时候，数据可快速回复。
因为每个Topic下可能有多个Queueu，所以存储结构为：HOME/store/consumequeue/{topic}/{queueId}/{fileName}。

2.3 IndexFile 索引文件

IndexFile 是一种可选索引文件，提供了一种可以通过 key 或时间区间来查询消息的方法，并且这种查找消息的方法不影响发送与消费消息的主流程。它的特征如下：

算法原理：IndexFile 索引文件的底层实现为 hash 索引，可以对照 Java 的HashMap比较，通过计算 Key 的 hashcode，取余获得 hash 槽，并通过拉链法解决哈希冲突。
大小限制：IndexFile 以创建时间戳命名，单个 IndexFile 文件大小约为 400M，一个 IndexFile 可以保存 2000W 个索引。

通过上面的三个部件说明可以了解到，RocketMQ 消息存储结构主要是由 CommitLog，ConsumeQueue，IndexFile 三部分组成的。当我们发送消息的时候，会执行如下过程：

消息格式化成 CommitLog的字段结构，并按照顺序写入到CommitLog 文件中。
Broker会按照 ConsumeQueue 的字段结构的要求创建一条索引记录。
按需创建IndexFile索引文件。

3 存储的执行过程

通过上面我们已经了解到了，Kafka 和 Rocket 均支持 10W+ 级别的吞吐，那么上述的存储结构是如何保持这样的高超性能的呢？

之前的章节我们已经了解到，Broker 启动时同步启动 NettyRemotingServer 进行端口监听，等坐等客户端的连接。
当客户端发送请求时，NettyRemotingServer WorkerGroup 处理可读事件，执行 processRequestCommand 处理来源消息数据。
接收到消息之后就需要存储下来了，DefaultMessageStore对数据进行校验，校验如下，校验完成之后发送存储指令。
- Broker 无响应时拒绝消息写入
- Broker 角色为 SLAVE 时也拒绝写入
- 判断是否支持写入，不支持写入时也拒绝
- topic length 小于等于 256 字符，否则拒绝消息写入
- 消息 length 小于等于 65536 字符，否则拒绝消息写入
- PageCache 繁忙时报错误消息，无法写入
DefaultMessageStore 调用 CommitLog.putMessage 存入消息
- 获取可以写入的 CommitLog 进行写入
- CommitLog（每个CommitLog默认1G大小）对应 MappedFile（程序视角），当有多个 MappedFiled 时，组成 MappedFileQueue。
- MappedFile 持有物理 CommitLog 的 fileChannel (Java NIO 文件读写的通道)，但并没有通过 fileChannel 直接访问物理 CommitLog 文件，而是映射到一个 MappedByteBuffer，并把序列化后的消息写入这个 ByteBuffer 中，已达到提升执行效率的目的。
- 最后写入 MappedFile 相对应的 CommitLog 文件中。

4 总结

理解好RabbitMQ 中 Broker 存储的组成要素 CommitLog，ConsumeQueue，IndexFile。
当 Broker 收到消息存储请求时，通过调用 CommitLog 对应的 MappedFile，把消息写入MappedFile的MeppedByteBuffer（内存映射）。

MQ系列8：数据存储，消息队列的高可用保障的更多相关文章

关于MQ的几件小事：如何保证消息队列的高可用
原文:https://www.cnblogs.com/jack1995/p/10908797.html 1.RabbitMQ的高可用 RabbitMQ基于主从模式实现高可用.RabbitMQ有三种模式 ...
关于MQ的几件小事（二）如何保证消息队列的高可用
1.RabbitMQ的高可用 RabbitMQ基于主从模式实现高可用.RabbitMQ有三种模式:单机模式,普通集群模式,镜像集群模式. (1)单机模式: 单机模式就是demo级别的,生产中不会有人使 ...
智能合约语言 Solidity 教程系列4 - 数据存储位置分析
写在前面 Solidity 是以太坊智能合约编程语言,阅读本文前,你应该对以太坊.智能合约有所了解, 如果你还不了解,建议你先看以太坊是什么这部分的内容官方英文文档讲的不是很透,因此我在参考Soli ...
c/c++ linux 进程间通信系列6，使用消息队列（message queue）
linux 进程间通信系列6,使用消息队列(message queue) 概念:消息排队,先进先出(FIFO),消息一旦出队,就从队列里消失了. 1,创建消息队列(message queue) 2,写 ...
【MQ】java 从零开始实现消息队列 mq-02-如何实现生产者调用消费者？
前景回顾上一节我们学习了如何实现基于 netty 客服端和服务端的启动. [mq]从零开始实现 mq-01-生产者.消费者启动 [mq]java 从零开始实现消息队列 mq-02-如何实现生产者调用 ...
MySQL 系列（五）多实例、高可用生产环境实战
MySQL 系列(五) 多实例.高可用生产环境实战第一篇:MySQL 系列(一) 生产标准线上环境安装配置案例及棘手问题解决第二篇:MySQL 系列(二) 史上最屌.你不知道的数据库操作第三 ...
SQL Server上唯一的数据库集群：负载均衡、读写分离、容灾(数据零丢失、服务高可用)
SQL Server上唯一的数据库集群:负载均衡.读写分离.容灾(数据零丢失.服务高可用).审计.优化,全面解决数据库用户问题.一键安装,易用稳定,性价比高,下载链接:http://www.zheti ...
MQ系列5：RocketMQ消息的发送模式
MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 MQ系列3:RocketMQ 架构分析 MQ系列4:NameServer 原理解析在之前的篇章中,我们学习了RocketMQ的原理, ...
RabbitMQ系列二（构建消息队列）
从AMQP协议可以看出,MessageQueue.Exchange和Binding构成了AMQP协议的核心.下面我们就围绕这三个主要组件,从应用使用的角度全面的介绍如何利用RabbitMQ构建消息队列 ...
基于Raft深度优化，腾讯云金融级消息队列CMQ高可靠算法详解
背景介绍分布式系统是指一组独立的计算机,通过网络协同工作的系统,客户端看来就如同单台机器在工作.随着互联网时代数据规模的爆发式增长,传统的单机系统在性能和可用性上已经无法胜任,分布式系统具有扩展性强 ...

随机推荐

re.sub()用法
原文链接:https://blog.csdn.net/jackandsnow/article/details/103885422
第六章：Django 综合篇 - 17：CSRF与AJAX
CSRF(Cross-site request forgery)跨站请求伪造,是一种常见的网络攻击手段,具体内容和含义请大家自行百度. Django为我们提供了防范CSRF攻击的机制. 一.基本使用 ...
第五章：Admin管理后台 - 2：自定义Admin actions
通常情况下,admin的工作模式是"选中目标,然后修改目标",但在同时修改大量目标的时候,这种模式就变得重复.繁琐. 为此,admin提供了自定义功能函数actions的手段,可以 ...
使用KubeOperator安装k8s集群后,节点主机yaml文件路径
[root@k8s-develop-master-1 kubernetes]# cd /etc/kubernetes [root@k8s-develop-master-1 kubernetes]# l ...
4.Gitlab CI 与 Kubernetes 的结合
参考网址:https://www.qikqiak.com/post/gitlab-ci-k8s-cluster-feature/
1-Mysql数据库简洁命令
1-进入mysql数据库 mysql -u root -p 2-创建数据库 mysql> CREATE DATABASE serurities_master; mysql> USE ser ...
[题解] Atcoder Regular Contest ARC 146 A B C D 题解
点我看题 A - Three Cards 先把所有数按位数从多到少排序,答案的位数一定等于位数最多的三个数的位数之和\(tot\).对于每个i,把有i位的数排序,并记录每个i的排序结果.最后枚举答案中 ...
prometheus监控实战
第一节.环境和软件版本 1.1.操作系统环境主机ip 操作系统部署软件备注 192.168.10.10 Centos7.9 Grafana.Pushgateway.Blackbox Export ...
2022-08-20-nas寄了就搞网络__网络升级计划_(估计又得白给)
layout: post cid: 13 title: nas寄了就搞网络? 网络升级计划 (估计又得白给) slug: 13 date: 2022/08/20 16:31:00 updated: 2 ...
SQL优化步骤
当生产数据量急剧增长后,很多SQL语句可能会开始暴露出性能问题.当面对一个有SQL性能问题的数据库时,应该从何处入手进行系统的分析,使得能够尽快定位到问题SQL处并尽快解决问题? 第一步:查看SQL执 ...

MQ系列8：数据存储，消息队列的高可用保障