【杂谈】Kafka的无锁设计
前言
在分布式消息队列系统中,Kafka 的无锁设计是其高吞吐量和高并发的核心优势之一。通过避免锁的竞争,Kafka 能够在高并发和大规模的生产环境中保持高效的性能。为了更好地理解 Kafka 的无锁设计,我们首先对比传统的队列模型,然后探讨 Kafka 如何通过无锁机制优化生产者和消费者之间的工作。
【应用级】多生产者,多消费者的队列是怎样的?
1)有锁的可变队列
在传统的队列模型中,生产者和消费者必须争抢锁来读写队列的数据:
- 生产者 在获得锁后将消息插入队列。
- 消费者 在获得锁后从队列中拉取消息。


为什么要用锁呢?用锁的目的是保护数据,防止数据被错误覆盖。
然而,在高并发场景下,锁竞争成为了一个瓶颈,尤其是在生产者和消费者数量庞大的情况下,锁竞争会显著影响队列的性能和吞吐量。
2)无锁的环形队列
在 Java 的 Disruptor 框架中,使用了性能优越的 RingBuffer(环形队列)作为存储结构。与传统队列不同,RingBuffer 在初始化时就预分配了内存空间,生产者和消费者通过读写指针来控制数据的读写位置
与上面的队列不同,这里的读操作不修改队列,仅修改指针
- 生产者:Disruptor推荐使用单生产者模式,这种性能最高。如果要使用多生产者模式,多个生产者需要通过CAS(Compare-And-Swap)来判断是否获得队列序号,进而修改队列。
- 消费者:单消费者模式,需要CAS竞争读指针序号。多消费模式,则维护各自的读指针,避免了竞争

Kafka 生产者如何实现无锁设计?
Kafka 生产者通过以下几种方式避免了锁的竞争,确保了高效的数据写入:
1)追加写入(Append-Only)
Kafka 的队列采用文件追加的方式来写入数据,这意味着每次数据写入都直接附加到文件末尾,而无需修改文件中的任何现有区域。这种设计避免了写入区域的竞争,也没有锁竞争的问题。即使有锁,也只是写锁,而文件追加操作本身是操作系统级别的原子操作,性能非常高。
2)批量提交
Kafka 生产者将多条消息批量打包成一个批次,并将整个批次作为一个单位提交到 Kafka Broker。通过批量提交,生产者无需为每条消息单独等待响应,这大大减少了锁竞争和网络延迟,从而显著提高了整体的吞吐量。


Kafka 消费者如何实现无锁设计?
Kafka 的消费者设计也遵循无锁的原则,具体体现在以下几个方面:
1)分区独占
每个 Kafka 分区 只能由同一个 消费组 内的一个消费者处理。这样,同一消费者组内的消费者不会发生资源竞争,每个消费者只需处理自己分配到的分区数据,避免了多个消费者间的干扰。
2)只读消费和偏移量管理
Kafka 消费者从 Broker 拉取数据后,只进行读取操作,不对数据进行修改。每个消费者维护自己的消费进度(即 偏移量),并在成功处理消息后提交偏移量。由于消费者不修改数据内容,他们之间不会互相干扰,也不需要竞争对数据的锁。不同消费者组之间会各自维护各自的消费进度,避免了相互之间的竞争。

总结
Kafka 的无锁设计通过多个机制有效避免了锁竞争,从而提升了系统的吞吐量和并发能力。通过批量提交、追加写入和分区独占等设计,Kafka 能够在高并发的环境中提供极高的性能。而消费者设计中的只读消费和偏移量管理,进一步优化了数据的读取效率,避免了无谓的竞争和资源浪费。这些无锁设计是 Kafka 高效、可靠的基础,确保它能够在大规模分布式环境中运行良好。
【杂谈】Kafka的无锁设计的更多相关文章
- 图解kubernetes scheduler基于map/reduce无锁设计的优选计算
优选阶段通过分离计算对象来实现多个node和多种算法的并行计算,并且通过基于二级索引来设计最终的存储结果,从而达到整个计算过程中的无锁设计,同时为了保证分配的随机性,针对同等优先级的采用了随机的方式来 ...
- 高性能无锁队列 Disruptor 初体验
原文地址: haifeiWu和他朋友们的博客 博客地址:www.hchstudio.cn 欢迎转载,转载请注明作者及出处,谢谢! 最近一直在研究队列的一些问题,今天楼主要分享一个高性能的队列 Disr ...
- 如何在高并发环境下设计出无锁的数据库操作(Java版本)
一个在线2k的游戏,每秒钟并发都吓死人.传统的hibernate直接插库基本上是不可行的.我就一步步推导出一个无锁的数据库操作. 1. 并发中如何无锁. 一个很简单的思路,把并发转化成为单线程.Jav ...
- MySQL 8.0:无锁可扩展的 WAL 设计
这篇文章整理自MySQL官方文档,介绍了8.0在预写式日志上实现上的修改,观点总结如下: 在8.0以前,为了保证flush list的顺序,redo log buffer写入过程需要加锁,无法实现并行 ...
- EasyDarwin开源流媒体服务器高性能设计之无锁队列
本文来自EasyDarwin团队Fantasy(fantasy(at)easydarwin.org) 一. EasyDarwin任务队列实现 EasyDarwin的任务队列是通过OSQueue类来组织 ...
- [转]透过 Linux 内核看无锁编程
非阻塞型同步 (Non-blocking Synchronization) 简介 如何正确有效的保护共享数据是编写并行程序必须面临的一个难题,通常的手段就是同步.同步可分为阻塞型同步(Blocking ...
- 非阻塞同步算法与CAS(Compare and Swap)无锁算法
锁(lock)的代价 锁是用来做并发最简单的方式,当然其代价也是最高的.内核态的锁的时候需要操作系统进行一次上下文切换,加锁.释放锁会导致比较多的上下文切换和调度延时,等待锁的线程会被挂起直至锁释放. ...
- paip.提升性能----java 无锁结构(CAS, Atomic, Threadlocal, volatile, 函数式编码, 不变对象)
paip.提升性能----java 无锁结构(CAS, Atomic, Threadlocal, volatile, 函数式编码, 不变对象) 1 锁的缺点 2 CAS(Compare ...
- Nah Lock: 一个无锁的内存分配器
概述 我实现了两个完全无锁的内存分配器:_nalloc 和 nalloc. 我用benchmark工具对它们进行了一组综合性测试,并比较了它们的指标值. 与libc(glibc malloc)相比, ...
- zeromq源码分析笔记之无锁队列ypipe_t(3)
在上一篇中说到了mailbox_t的底层实际上使用了管道ypipe_t来存储命令.而ypipe_t实质上是一个无锁队列,其底层使用了yqueue_t队列,ypipe_t是对yueue_t的再包装,所以 ...
随机推荐
- 64.element表单校验注意点
<!-- 表单验证三要素: --> <!-- ① el-form需要有 model属性[表单数据对象].rules属性[验证规则对象].ref属性[引用字符串] --> < ...
- (系列六).net8 全局异常捕获机制
说明 该文章是属于OverallAuth2.0系列文章,每周更新一篇该系列文章(从0到1完成系统开发). 该系统文章,我会尽量说的非常详细,做到不管新手.老手都能看懂. 说明:OverallAuth2 ...
- AI网关在应用集成中起到什么作用?
现在,国内外几乎每个SaaS服务商都找到办法把大型语言模型(LLM)集成到自己的产品里.印证了那句话"每款SaaS都值得用AI重做一遍"我们暂且不讨论是否值得用AI重做,但是增加A ...
- 关系图谱后端不给指向性字段使用children
.markdown-body { line-height: 1.75; font-weight: 400; font-size: 16px; overflow-x: hidden; color: rg ...
- 一文读懂 Prometheus 长期存储主流方案
嘉宾 | 霍秉杰 整理 | 西京刀客 出品 | CSDN 云原生 Prometheus 作为云原生时代崛起的标志性项目,已经成为可观测领域的事实标准.Prometheus 是单实例不可扩展的,那么如果 ...
- 自学PHP笔记(一)PHP语法
PHP基本语法 php使用一对特殊的标记包含php代码,与HTML代码混在一起.当服务器解析页面时,能够自动过滤出PHP脚本并进行解释,最后把生成的静态网页传递给客户端. 1.PHP标记 一般情况下, ...
- OpenPSG:离AGI再进一步,首个开放环境关系预测框架 | ECCV'24
全景场景图生成(PSG)的目标是对对象进行分割并识别它们之间的关系,从而实现对图像的结构化理解.以往的方法主要集中于预测预定义的对象和关系类别,因此限制了它们在开放世界场景中的应用.随着大型多模态模型 ...
- SLAM中的各种地图
1.地图的不同分类方式 地图有多种不同的分类方式,网上有不少帖子介绍各种各样的地图,但并没有非常完整的总结地图应该怎么分类.论文[1]中将地图分成以下几种:拓扑地图.度量地图.度量-语义地图和混合地图 ...
- 3.11 Linux删除空目录(rmdir命令)
和 mkdir 命令(创建空目录)恰好相反,rmdir(remove empty directories 的缩写)命令用于删除空目录,此命令的基本格式为: [root@localhost ~]# rm ...
- PSD.See 隐私政策声明
PSD.See will not collect any user privacy data. PSD.See 不会收集任何用户隐私数据.