RocketMQ消息是如何存储的
RocketMQ的消息存储是一个复杂而高效的过程,设计上充分考虑了性能和扩展性,
消息存储的主要组件包括CommitLog文件、消费队列文件(ConsumerQueue)、以及索引文件(IndexFile)
一、CommitLog文件
CommitLog是Rocketmq的核心存储文件,负责保持消息的完整内容
顺序写入:所有的消息都是顺序写入CommitLog文件,这种方式减少了磁盘寻道时间,提高了写入性能
文件滚动:CommitLog按照固定大小(比如1GB)进行分片。当一个文件写满后,会创建一个新的文件
存储所有数据:包括消息体、主题、队列ID等
刷盘策略:
同步刷盘(SYNC_FLUSH):消息写入磁盘后才返回 ACK,可靠性高但性能较低
异步刷盘(ASYNC_FLUSH):消息写入 PageCache 后立即返回 ACK,由后台线程定期刷盘(默认策略)
二、ConsumerQueue
ConsumerQueue是针对消息的逻辑图,指在加快消费者对消息的快速定位
异步分发:后台线程 ReputMessageService 定时从 CommitLog 提取消息,按 Topic 和 Queue 分发到对应的 ConsumeQueue
索引结构:每个 ConsumeQueue 条目固定 20 字节,包含:
| CommitLog Offset (8B) | Size (4B) | Message Tag Hash (8B) | 通过 CommitLog Offset 和 Size 可快速定位消息在 CommitLog 中的位置
三、可选,构建 IndexFile
- 哈希索引:根据消息的 Key 或 Tag 构建哈希索引(IndexFile),支持按消息 Key 查询(如事务消息回查)
四、消息读取流程(消费过程)
1、消费者拉取消息:
根据 Topic 和 Queue ID 找到对应的 ConsumeQueue
从 ConsumeQueue 中读取条目,获取消息在 CommitLog 的物理偏移量(Offset)和 Size
2、定位 CommitLog:
- 根据 CommitLog Offset 和 Size,直接从 CommitLog 文件读取完整消息内容
五、存储优化机制
1、页缓存(PageCache)加速
RocketMQ 利用 Linux 的 PageCache 机制,优先读写内存缓存,大幅减少磁盘 IO
建议:Broker 机器预留 50% 内存供 PageCache 使用
2、文件预分配
- CommitLog 和 ConsumeQueue 文件预先分配固定大小(如 1GB),避免动态扩容带来的性能抖动
3、过期文件清理
- 默认保留 72 小时消息,可通过配置调整:

后台线程定期删除过期文件,释放磁盘空间
六、高可用设计
1、主从同步(Replication)
同步复制(SYNC_MASTER):Master 需等待 Slave 存储成功后才返回 ACK,确保数据不丢失
异步复制(ASYNC_MASTER):Master 写入后立即返回 ACK,性能更高但可能丢消息
2、故障恢复
Broker 宕机:Slave 自动切换为 Master(需配合 DLedger 或 RAFT 协议)
磁盘损坏:从 Slave 节点恢复数据
七、存储配置建议

八、可视化存储状态
通过命令查看存储状态:

九、总结
CommitLog:消息全集,顺序写入,保证高吞吐。
ConsumeQueue:逻辑队列索引,内存映射加速检索。
设计优势:
顺序写盘 + 异步构建索引 → 高性能。
主从同步 + 刷盘策略 → 高可靠。
适用场景:
- 顺序写、随机读的日志型存储模型,适合消息中间件场景。
RocketMQ消息是如何存储的的更多相关文章
- 从源码分析RocketMq消息的存储原理
rocketmq在存储消息的时候,最终是通过mmap映射成磁盘文件进行存储的,本文就消息的存储流程作一个整理.源码版本是4.9.2 主要的存储组件有如下4个: CommitLog:存储的业务层,接收& ...
- RocketMQ消息轨迹-设计篇
目录 1.消息轨迹数据格式 2.记录消息轨迹 3.如何存储消息轨迹数据 @(本节目录) RocketMQ消息轨迹主要包含两篇文章:设计篇与源码分析篇,本节将详细介绍RocketMQ消息轨迹-设计相关. ...
- 源码分析RocketMQ消息轨迹
目录 1.发送消息轨迹流程 1.1 DefaultMQProducer构造函数 1.2 SendMessageTraceHookImpl钩子函数 1.3 TraceDispatcher实现原理 2. ...
- RocketMQ(消息重发、重复消费、事务、消息模式)
分布式开放消息系统(RocketMQ)的原理与实践 RocketMQ基础:https://github.com/apache/rocketmq/tree/rocketmq-all-4.5.1/docs ...
- RocketMQ消息模型
rocketmq采用的是发布-订阅的模式,不需要每个消费者维护自己的消息队列,生产者将消息发送到topic,消费者订阅此topic 读取消息. 基本概念: 消息模型:消息模型包括producer,co ...
- RocketMQ 消息丢失场景分析及如何解决
生产者产生消息发送给RocketMQ RocketMQ接收到了消息之后,必然需要存到磁盘中,否则断电或宕机之后会造成数据的丢失 消费者从RocketMQ中获取消息消费,消费成功之后,整个流程结束 1. ...
- 一张图进阶 RocketMQ - 消息发送
前 言 三此君看了好几本书,看了很多遍源码整理的 一张图进阶 RocketMQ 图片链接,关于 RocketMQ 你只需要记住这张图!觉得不错的话,记得点赞关注哦. [重要]视频在 B 站同步更新,欢 ...
- RocketMQ消息短暂而又精彩的一生
大家好,我是三友~~ 这篇文章我准备来聊一聊RocketMQ消息的一生. 不知你是否跟我一样,在使用RocketMQ的时候也有很多的疑惑: 消息是如何发送的,队列是如何选择的? 消息是如何存储的,是如 ...
- RocketMq消息队列使用
最近在看消息队列框架 ,alibaba的RocketMQ单机支持1万以上的持久化队列,支持诸多特性, 目前RocketMQ在阿里集团被广泛应用在订单,交易,充值,流计算,消息推送,日志流式处理,bin ...
- 程序重启RocketMQ消息重复消费
最近在调试RocketMQ消息发送与消费的Demo时,发现一个问题:只要重启程序,RocketMQ消息就会重复消费. 那么这是什么原因导致的,又该如何解决呢? 经过一番排查,发现程序使用的Rocket ...
随机推荐
- w3cschool-Groovy 教程
Groovy的特点 Groovy中有以下特点: 同时支持静态和动态类型. 支持运算符重载. 本地语法列表和关联数组. 对正则表达式的本地支持. 各种标记语言,如XML和HTML原生支持. Groovy ...
- 虚拟化技术 - CPU虚拟化
本文分享自天翼云开发者社区<虚拟化技术 - CPU虚拟化>,作者:谢****悦 物理机器是由CPU,内存和I/O设备等一组资源构成的实体.虚拟机也一样,由虚拟CPU,虚拟内存和虚拟I/O设 ...
- Amazon Dynamo系统架构
Amazon Dynamo系统架构 目录 Amazon Dynamo系统架构 0x00 摘要 0x01 Amazon Dynamo 1.1 概况 1.2 主要问题及解决方案 1.3 数据均衡分布 1. ...
- shell脚本sed命令
Sed 是一个脚本型的编译器,全称StreamEDitor,即流编辑器是非交互式的编辑器 sed 原理简析sed 以行为处理单位,每次从标准输入/文本获取一行信息,存储到其" 模式空间 &q ...
- pytest自动化测试 - 我对测试用例超时处理的一点看法
1 pytest自动化测试 - 我对测试用例超时处理的一点看法 1.1 背景 用例在执行过程中,可能由于网络等待,或者等待一些特殊的文件,而又由于一些异常,导致这些条件一直不能满足,用例卡死,这种 ...
- C语言程序设计手写笔记
最近自己录了一个自学C语言系列,笔记发出来,视频还在传
- Deepin搭建git仓库服务gogs,debian也可用
我尝试了gitlab.gitblit搭建均失败,deepin版本20.03 1. 步骤 访问gogs官网下载&安装页面 数据库(选择以下一项): MySQL:版本 >= 5.7. Pos ...
- C#开发手册
一. 编码规范 (一)[强制]命名规范:所有命名(类名.属性名.变量名.常量名.属性名)必须以字母开头(a-z.A-Z),不能以特殊字符(_.$)开头. 1.[强制]类名命名规则:大驼 ...
- Mysql join算法深入浅出
导语 联表查询在日常的数据库设计中非常的常见,但是联表查询可能会带来性能问题,为了调优.避免设计出有性能问题的SQL,在explain命令中,会显示用的是哪个join算法,学习一下join过程是非常有 ...
- 部署sing-box代理服务器绕过付费校园网上网
解决的问题 学校一般会有2个网络,一个是教学区的免费校园网,一个是寝室楼的付费校园网.如何不交钱也能在寝室楼上网是一个问题. 以及,如果校园网在12点之后断网,如果解决断网问题 sing-box Gi ...