【杂谈】Kafka 消息偏移量：如何高效地定位和管理消息？

猫毛·波拿巴 2024-12-26 12:52:25 原文

前言

在 Kafka 中，消息偏移量是什么？是文件中的索引吗？又是如何通过偏移量快速定位消息的？本文将深入探讨这些问题，帮助你更好地理解 Kafka 的偏移量机制。

Kafka 的偏移量是什么？

Kafka 中的 偏移量 实际上是每条消息的序号。它为每条消息提供了一个唯一的标识。通过偏移量，消费者可以准确地找到并读取特定的消息。

偏移量在 Topic 中是唯一的吗？

答案是否定的，偏移量 仅在每个分区内是唯一的。一个 Topic 可能有多个分区，每个分区的消息都有一个递增的偏移量。因此，Kafka 不需要对所有分区的消息偏移量进行全局同步。每个分区独立管理自己的偏移量，这不仅减少了复杂性，还降低了性能开销。

消息的偏移量由谁决定？客户端还是服务端？

偏移量是由 服务端 决定的。客户端无法了解其他客户端的偏移量情况，如果由客户端决定，则需要额外的同步成本来实现全局偏移量管理。所以，消息的偏移量是由 Kafka 服务端来维护的。

单调递增的序号是否会达到最大值？

理论上，不会。Kafka 使用 64 位长整型（long）作为偏移量，其最大值为 2^63 - 1，即 9223372036854775807。在正常的消息生产速率下，偏移量的增长将持续数百年，远远不需要担心达到最大值。

举个例子：假设每个分区每秒钟写入 1 万条消息，那么偏移量达到上限大约需要 29,200 年。如此长的时间，几乎可以忽略不计。

Kafka 如何根据消息偏移量定位到文件中的位置？

既然我们知道 Kafka 的消息存储在文件中，那么问题就来了：如何根据“序号”定位到文件中的具体位置呢？

答案是 索引文件。Kafka 为每个分区维护一个索引文件，该文件记录了每个消息的偏移量及其对应的存储位置。通过索引文件，Kafka 可以非常快速地定位到某个偏移量对应的消息存储位置。

实际上，索引文件通常记录的是消息的起始位置，而每条消息的结束位置可以通过消息头来确定。

联想：Socket 通道的数据处理

这种设计让我联想到 Socket 通道 中的数据处理。Socket 通道也是连续的字节流，服务端根据 消息头 来解析报文的起始和结束位置，从而确定数据的边界。服务端可以连续地从字节流中提取完整的报文进行处理。

相同之处：

都是通过消息头来解析数据边界。

不同之处：

Socket 通道中的数据是即时消费的，而 Kafka 的数据存储在磁盘中，等待被消费。
Kafka 消费者并不是从头开始消费，而是从特定的偏移量位置开始消费，这需要额外的定位操作，即通过索引文件来定位消息的起始位置。

Kafka 如何高效读取多条消息？

假设我们要读取一批消息，比如 100 条。显然，Kafka 不会每次都查找索引文件并定位单独的消息偏移量。实际情况是，Kafka 会根据 起始消息的位置 和 最后一条消息的位置，一次性将这一段消息批量读取出来。通过这种方式，Kafka 避免了多次查询索引文件，从而显著提高了读取效率。

一个分区的日志段文件有多个，具体如何实现？

Kafka 的日志段文件有最大值（log.segment.bytes）和最大存活时间（log.segment.ms）限制。

当文件达到最大大小或超过最大存活时间时，Kafka 会关闭旧文件并开启新文件。

那么，是每个分区只有一个索引文件吗？

答案是否定的。实际上，每个日志段文件（以 .log 为后缀）都有一个对应的 索引文件（以 .index 为后缀）。

注意：关闭日志段仅意味着它不再接受新的消息写入，但已经存储的数据仍然可以被消费者访问。

日志段在被删除之前都能被访问，至于何时删除详见保留配置 log.retention.*

如何知道要查找哪个文件？

每个日志段文件的文件名就是该段的 起始偏移量。通过文件名，你可以知道消息存储在哪个文件中。接着，Kafka 通过该文件的索引文件来找到消息的具体位置。

00000000000000000000.log（偏移量从 0 到 9999）
00000000000000000000.index
00000000000000010000.log（偏移量从 10000 到 19999）
00000000000000010000.index

既然索引可以直接定位，Kafka为何还要限制日志段文件的大小？

因为内存映射。 Kafka 使用内存映射文件（Memory Mapped Files）来高效地处理日志的读取和写入。内存映射文件将文件映射到内存中，这样 Kafka 可以直接在内存中读取或写入数据，而无需频繁进行 I/O 操作，从而大大提高了性能。

但是，操作系统对内存映射文件的大小是有限制的，因此 Kafka 会限制单个日志段文件的大小。具体来说：

操作系统的内存映射限制： 每个操作系统对于内存映射的文件大小都有一定的限制。单个文件过大可能会超出这一限制，从而影响性能，甚至导致程序崩溃。
内存占用问题： 内存映射会将文件的部分内容加载到系统内存中，文件过大时，可能会导致系统内存占用过多，从而影响其他进程或系统的稳定性。尤其是在高负载环境下，操作系统可能无法为过大的文件提供足够的内存资源。

题外话：

1.正因如此，Kafka 通常建议将其单独部署在独立的服务器上，避免与其他应用争夺内存资源。这样能够确保 Kafka 的内存映射操作更加高效，并减少内存资源的竞争。

2.为了吞吐量，Kafka不会主动刷盘，刷盘依赖操作系统。刷新时间可能在几秒到几分钟之间。

【杂谈】Kafka 消息偏移量：如何高效地定位和管理消息？的更多相关文章

转 Kafka、RabbitMQ、RocketMQ等消息中间件的对比 —— 消息发送性能和优势
Kafka.RabbitMQ.RocketMQ等消息中间件的对比 —— 消息发送性能和优势引言分布式系统中,我们广泛运用消息中间件进行系统间的数据交换,便于异步解耦.现在开源的消息中间件有很多,前 ...
rocketMq 消息偏移量 Offset
消息偏移量 Offset queue0 offset 0 0-20 offset 4 20-40 纠错:每条消息的tag对应的HashCode. queue1 offset 1 0-20 ...
Apache Samza流处理框架介绍——kafka+LevelDB的Key/Value数据库来存储历史消息+？
转自:http://www.infoq.com/cn/news/2015/02/apache-samza-top-project Apache Samza是一个开源.分布式的流处理框架,它使用开源分布 ...
RocketMQ(消息重发、重复消费、事务、消息模式)
分布式开放消息系统(RocketMQ)的原理与实践 RocketMQ基础:https://github.com/apache/rocketmq/tree/rocketmq-all-4.5.1/docs ...
分布式开放消息系统RocketMQ的原理与实践（消息的顺序问题、重复问题、可靠消息/事务消息）
备注:1.如果您此前未接触过RocketMQ,请先阅读附录部分,以便了解RocketMQ的整体架构和相关术语2.文中的MQServer与Broker表示同一概念分布式消息系统作为实现分布式系统可扩展 ...
RabbitMQ入门教程(十七)：消息队列的应用场景和常见的消息队列之间的比较
原文:RabbitMQ入门教程(十七):消息队列的应用场景和常见的消息队列之间的比较分享一个朋友的人工智能教程.比较通俗易懂,风趣幽默,感兴趣的朋友可以去看看. 这是网上的一篇教程写的很好,不知原作 ...
交易系统使用storm,在消息高可靠情况下，如何避免消息重复
概要:在使用storm分布式计算框架进行数据处理时,如何保证进入storm的消息的一定会被处理,且不会被重复处理.这个时候仅仅开启storm的ack机制并不能解决上述问题.那么该如何设计出一个好的方案 ...
ZeroMQ接口函数之：zmq_msg_move - 将一个消息里面的内容移动到另一个消息里面
ZeroMQ 官方地址 :http://api.zeromq.org/4-1:zmq_msg_move zmq_msg_move(3) ØMQ Manual - ØMQ/3.2.5 Name zm ...
(转)RabbitMQ消息队列（九）：Publisher的消息确认机制
在前面的文章中提到了queue和consumer之间的消息确认机制:通过设置ack.那么Publisher能不到知道他post的Message有没有到达queue,甚至更近一步,是否被某个Consum ...
[转] C#中发送消息给指定的窗口，以及接收消息
原文C#中发送消息给指定的窗口,以及接收消息 public class Note { //声明 API 函数 [DllImport("User32.dll", EntryPoint ...

随机推荐

js递归遍历树形结构数据，获取所有数组id集合
function getAllIds(tree, result) { //遍历树获取id数组 for (const i in tree) { result.push(tree[i].id); // ...
05 Transformer 中的前馈神经网络（FFN）的实现
2:20:理论链接博客配套视频链接: https://space.bilibili.com/383551518?spm_id_from=333.1007.0.0 b 站直接看配套 github 链 ...
Maven的安装部署（不踩雷版）
在idea中配置maven需注意maven版本和idea版本相匹配.本人使用idea版本为2020.3,jdk1.8,maven3.6.3可以与之相匹配. 一.下载maven maven下载官网地址: ...
「模拟赛」多校 A 层联训 5
A.好数(number) 很签,打完之后"不是这题我能做一个小时??" 对于每个数,都把它与前面的所有数的加和求一遍存进桶里,再遇到一个新数 \(a_i\) 时,枚举前面的所有 \ ...
调试npm下载的组件
.markdown-body { line-height: 1.75; font-weight: 400; font-size: 16px; overflow-x: hidden; color: rg ...
Kubernetes 跨 StorageClass 迁移 Persistent Volumes 完全指南
大家好,我是米开朗基杨. KubeSphere 3.3.0 (不出意外的话~)本周就要 GA 了,作为一名 KubeSphere 脑残粉,我迫不及待地先安装 RC 版尝尝鲜,一顿操作猛如虎开启所有组件 ...
ToDesk云电脑堪比万元PC？黑悟空、老头环及战锤40K实测体验！
2009年,OnLive首次在旧金山游戏开发者大会推出"云游戏"的概念,但受限于当时的网络宽带技术,云游戏并不被十分看好.现如今,5G时代已然到来,数据通量和画质传输给予云游戏崛起 ...
.NET云原生应用实践（四）：基于Keycloak的认证与授权
本章目标完成Keycloak的本地部署与配置在Stickers RESTful API层面完成与Keycloak的集成在Stickers RESTful API上实现认证与授权 Keycloak ...
Power BI 网关无法添加My SQL数据集
今天第一次发布数据类型为MySQL的数据集到Power BI报表服务器,desktop的连接正常,但是发布到web端后,添加网关时却提示以下错误,如下图所示: 错误信息: 无法创建连接,原因如下: 无 ...
vue通过ollama接口调用开源模型
先展示下最终效果: 第一步:先安装ollama,并配置对应的开源大模型. 安装步骤可以查看上一篇博客: ollama搭建本地ai大模型并应用调用第二步:需要注意两个配置,页面才可以调用 1)OLL ...