【RocketMQ源码分析】深入消息存储（2）

前文回顾

CommitLog篇 ——【RocketMQ源码分析】深入消息存储（1）

MappedFile篇 ——【RocketMQ源码分析】深入消息存储（3）

前文说完了一条消息如何被持久化到本地磁盘CommitLog，本篇就要谈谈如何从CommitLog来构建我们消息消费的核心队列结构ConsumeQueue了。

之前已经说过，CommitLog文件是消息的大杂烩，所有消息具体都被放到了这个大文件中，而ConsumeQueue则是一个逻辑上的队列，也是消息消费的核心，它存在Topic与Queue这两个概念，也就是消费者在消费时需要关心的东西。

除了ConsumeQueue目录下存在Topic与QueueId组成的两级目录，它实际存储消息的文件也是与CommitLog相似，是一个文件名代表offset的文件。

在ConsumeQueue中，每一个单元结构如下图：

CommitLog Offset : 8 Byte

Size : 4 Byte

Message Tag Hashcode : 8 Byte

第一个8Byte的CommitLog Offset代表该消息在CommitLog文件中的偏移位置。

第二个4Byte的Size代表消息的大小。

凭借CommitLog Offset与Size就可以在CommitLog中定位一条消息。

而第三个字段Message Tag Hashcode则是用来快速过滤消息。

可以发现，ConsumeQueue中每个消息占据20Byte，也就是说如果MessageStoreConfig的mappedFilesizeConsumeQueue设置为100Byte，那么每个ConsumeQueue文件只能存储5条消息。

了解完ConsumeQueue，接下来就需要知道ConsumeQueue是在什么时候构建的，在上一篇CommitLog存储消息时，我们没有看到有写入ConsumeQueue，那是因为ConsumeQueue是由一个异步线程去构建的。

异步构建流程如下，DefaultMessageStore的内部类ReputMessageService继承自ServiceThread，其run方法中每1毫秒调用一次doReput方法。

reputFromOffset是初始开始同步的偏移位置，默认为0。

在doReput方法中进行了ConsumeQueue的构建。

首先，是一个只有在异常情况下才会终止的for循环，doNext只有返回值错误的情况下才会设为false，可以理解为一个死循环。

如果当前reput的偏移量大于等于已确认的，就不需要构建。

如果符合条件，就从CommitLog中读取对应位置的数据，如果返回null，就终止当前for死循环，不为null则去构建ConsumeQueue。

可以看看result返回了什么。

如果result不为null，获取起始偏移位置，并且设置为doReput的reputFromOffset偏移量。

之后进入checkMessageAndReturnSize方法，该方法就是从result变量的buffer中读取消息的具体数据了，一堆buffer.get操作，此处不列出了，感兴趣可以看CommitLog#checkMessageAndReturnSize方法。

方法最后包装了一个DispatchRequest对象返回。

可以看看此处Debug拿到的DispatchRequest，主要有Topic名称，在CommitLog中的偏移位置，以及消息大小，如果你还记得上一篇CommitLog在最后判断CommitLog文件能不能存下这条消息时，可以看到当时就是一个121字节加8字节魔术大小的消息，在此处成功读取到了。

读取成功之后，就要构建ConsumeQueue了。

进入doDispatch方法，可以看到要构建的目标是有一个list，是CommitLogDispatcher的子类做了实现。

可以看到下图，实现有ConsumeQueue和Index两个，也就是说ConsumeQueue和Index文件的异步构建都是在此处，两个类都位于DefaultMessageStore中。

ConsumeQueue是逻辑消息队列，Index则是消息索引文件，存储了消息的存储时间，哈希，偏移量等信息，本篇主要看ConsumeQueue，所以走到CommitLogDispatcherBuildConsumeQueue的实现即可。

首先获取了消息类型，进入putMessagePositionInfo方法。

putMessagePositionInfo中分为两步，首先拿到ConsumeQueue对象，然后放入请求。

第一步的findConsumeQueue，可以根据topic和queueId来定位一个ConsumeQueue，正如我们之前看到了目录结构，这个获取的流程是先查找map，这个没有就新建。

步骤如下图，首先从table中拿到ConsumeQueue，如果没有拿到，就新建一个key是指定topic的结构，添加进table。

consumeQueueTable结构如下，是一个ConcurrentMap<String, ConcurrentMap<Integer,ConsumeQueue>>。

拿到consumeQueueTable内置的map之后，就可以根据QueueId拿到目标ConsumeQueue了。

如果有，直接返回，如果没有，就说明需要初始化该ConsumeQueue了，初始化完成之后放入consumeQueueTable，并且返回该ConsumeQueue。

拿到ConsumeQueue就可以对请求进行构建了，进入putMessagePositionInfoWrapper方法。

首先获取了当前Store状态是否可写，如果可写，会在for循环内尝试maxRetries次构建，该值是30次。

在for循环内，首先拿到了tag，然后在isExtWriteEnable处判断配置是否启用了写入扩展信息，如果开启，会在一个ConsumeQueueExt的结构中写入存储时间、Tag、bitMap等信息，此处先跳过。

此时调用了putMessagePositionInfo方法写入，如果返回result成功的话，直接return，否则休眠一秒钟，然后继续for循环，根据maxRetries的值，可以有30次机会。

进入putMessagePositionInfo方法，可以看到向ConsumeQueue的byteBufferIndex中put了数据，该buffer是何时初始化的呢？

ConsumeQueue的构造函数中，就对byteBufferIndex进行了初始化

public static final int CQ_STORE_UNIT_SIZE = 20;

可以看到buffer的大小只有20字节，符合我们之前说的每个消息在ConsumeQueue中的大小。

而putMessagePositionInfo中首先也对byteBufferIndex进行了flip操作，也就是读写模式的切换，此处切换到了写模式，并且将目标数据放入buffer中。

之后就是熟悉的MappedFile操作，可以参考上一篇CommitLog中讲述的MappedFile。

最后appendMessage将消息写入文件channel中，等待刷盘时持久化。

以上就是ConsumeQueue的构建流程了。

【RocketMQ源码分析】深入消息存储（2）的更多相关文章

【RocketMQ源码分析】深入消息存储（3）
前文回顾 CommitLog篇 --[RocketMQ源码分析]深入消息存储(1) ConsumeQueue篇 --[RocketMQ源码分析]深入消息存储(2) 前面两篇已经说过了消息如何存储到Co ...
RocketMQ 源码分析 —— Message 发送与接收
1.概述 Producer 发送消息.主要是同步发送消息源码,涉及到异步/Oneway发送消息,事务消息会跳过. Broker 接收消息.(存储消息在<RocketMQ 源码分析 —— Mes ...
RocketMQ源码分析之从官方示例窥探：RocketMQ事务消息实现基本思想
摘要: RocketMQ源码分析之从官方示例窥探RocketMQ事务消息实现基本思想. 在阅读本文前,若您对RocketMQ技术感兴趣,请加入RocketMQ技术交流群 RocketMQ4.3.0版本 ...
【RocketMQ源码分析】深入消息存储（1）
最近在学习RocketMQ相关的东西,在学习之余沉淀几篇笔记. RocketMQ有很多值得关注的设计点,消息发送.消息消费.路由中心NameServer.消息过滤.消息存储.主从同步.事务消息等等. ...
RocketMQ源码分析之RocketMQ事务消息实现原理上篇(二阶段提交)
在阅读本文前,若您对RocketMQ技术感兴趣,请加入 RocketMQ技术交流群根据上文的描述,发送事务消息的入口为: TransactionMQProducer#sendMessageInTra ...
ROCKETMQ源码分析笔记1：tools
rocketmq源码解析笔记大家好,先安利一下自己,本人男,35岁,已婚.目前就职于小资生活(北京),职位是开发总监. 姓名DaneBrown 好了.我保证本文绝不会太监!转载时请附上以上安利信息. ...
RocketMQ源码分析 broker启动，commitlog、consumequeue、indexfile、MappedFileQueue、MappedFile之间的关系以及位置说明
目录 1.MappedFile类属性说明 1.1.MappedFile类属性如下 1.2.MappedFile构造器说明 2.MappedFileQueue类说明 2.1.属性说明 2.2.Mappe ...
ROCKETMQ源码分析笔记2：client
CLIENT 之前讲过tools里面有大量调用client的东西.为了从源码层面了解rocket,决定啃下client这块骨头. pom 先看pom,看看CLIENT依赖谁.看完后原来是依赖commo ...
RocketMQ 源码分析之路由中心(NameServer)
你可能没有看过 RocketMQ 的架构图,没关系,一起来学习一下,RocketMQ 架构图如下: 在 RocketMQ 中,有四个角色: Producer:消息的生产者,每个 MQ 中间件都有. C ...

随机推荐

website & blogs & about me & contact
website & blogs & about me & contact demos https://davidwalsh.name/about-david-walsh htt ...
scrimba & interactive free online tutorials
scrimba & interactive free online tutorials https://github.com/scrimba/community/blob/master/FAQ ...
安装 Angular Material UI
文档调色板安装 ng add @angular/material ? Choose a prebuilt theme name, or "custom" for a custo ...
为什么说NGK公链的商用落地是可行的？
互联网.大数据以及云计算的发展给人们的生活.工作带来了诸多便利,也让人们一次又一次感叹科技的进步.而NGK公链的诞生,更是让众人称之为传奇.其商用落地可行性,也让人惊叹.那么,为什么说NGK公链的商用 ...
[转]自动驾驶平台Apollo 2.5环境搭建
原文地址:https://blog.csdn.net/jinzhuojun/article/details/80210180,转载主要方便随时查阅,如有版权要求,请及时联系. 我们知道,自动驾驶在学界 ...
rabbitMQ高可用方案
普通模式默认的集群模式,以两个节点(rabbit01.rabbit02)为例来进行说明.对于Queue来说,消息实体只存在于其中一个节点rabbit01(或者rabbit02),rabbit01和r ...
Java ThreadPoolExecutor详解
ThreadPoolExecutor是Java语言对于线程池的实现.池化技术是一种复用资源,减少开销的技术.线程是操作系统的资源,线程的创建与调度由操作系统负责,线程的创建与调度都要耗费大量的资源,其 ...
winform导入excel或者csv
if (txt01.Text != "") { this.lbzhantie.Items.Clear(); this.dtzhuanhuo.Rows.Clear(); if (tx ...
后端程序员之路 30、webapi测试工具的一点想法
有了webapi,对应的,也就要有各种语言的sdk,有时候,还要有一个好用的api测试工具.sdk和api测试工具在功能上有一些异同,有时候测试工具会直接基于sdk来制作. 它们通常包含: 1.htt ...
区分函数防抖&函数节流
1. 概念区分函数防抖:触发事件后,在n秒内函数只能执行一次,如果触发事件后在n秒内又触发了事件,则会重新计算函数延执行时间. 简单说: 频繁触发, 但只在特定的时间内才执行一次代码,如果特定时间内 ...

【RocketMQ源码分析】深入消息存储（2）

前文回顾

【RocketMQ源码分析】深入消息存储（2）的更多相关文章

随机推荐

热门专题