Kafka多维度调优

优化金字塔

应用程序层面

框架层面（Broker层面）

JVM层面

操作系统层面

应用程序层面：应当优化业务代码合理使用kafka，合理规划主题，合理规划分区，合理设计数据结构；

框架层面：在不改动源码的情况下，从kafka参数配置入手，结合业务体量和运行数据进行调优

JVM层面：在出现明显缓慢和可能的内存溢出的情况下，结合业务代码情况和服务器能力调优堆内存，非堆内存，GC方式等参数，非必要不更改过多参数

操作系统层面：在服务器操作系统层面调优尽量减少kafka程序运行限制，关注文件描述符限制，Selinux限制，JDK版本等情况

操作系统调优

文件系统的选择上，可选择XFS和EXT4，生产环境推荐XFS，具备高性能和高伸缩性优点，最新的报道显示具备多级缓存的ZFS针对高IO的kafka有不错的效果，但并未大规模验证

Swap空间参数设置：尽量设置小一点，修改/etc/sysctl.conf文件，增加vm.swappiness=，防止Linux OOM Killer线程随意杀线程

文件描述符：ulimit -n不能设置过小，在topic数量稍大时就会出现Too Many File Open报错情况

控制进程可以拥有的内存映射区域的最大数量：vm.max_map_count，设置过小会出现内存溢出情况

操作系统页缓存：由于Kafka存储数据时只要数据到来Page Cache页缓存就会返回Ack给生产者，并不会直接落盘，还需要等待触发或手动刷盘操作进行持久化刷盘，此时操作系统的Cached大小必须超过一个日志段大小，Broker上对应参数为log.segment.bytes，越大消费者在消费时有更大概率在缓存页命中，避免频繁IO从硬盘读取数据。

JVM层面调优

(1)堆内存参数设置：kafka本身并不占用过多堆内存，6-8G相对合适，在kafka-server-start.sh设置KAFKA_HEAP_OPTS参数即可；更精确可以查看KafkaServer-gc.log，关注Full GC之后堆上存活大小的总量，从而可以将堆内存设置为这个值的2-2.5倍，可以使用图上命令进行手动GC

(2)GC选择器：博主kafka3.5.1版本的kafka集群使用openjdk11.0.X，默认G1收集器；在G1中Full GC是单线程运行，在生产环境中要尽量避免Full GC

(3)JDK选择：至少JDK1.8，推荐JDK11，kafka3.0推荐至少使用JDK11

框架调优（Broker层面）

(1)版本适配：尽量保持客户端版本和Broker端版本一致或尽量适配，以避免版本之间不一致问题导致的性能优化损失，如零拷贝等特性

(2)消息压缩方式：Broker端和Producer段的消息压缩方式应该保持一致，推荐lz4，第二选择gzip，如果设置得不一致会导致Broker付出大量额外的CPU性能用于解压和二次压缩

(3)num.io.thread：Handler线程用于执行业务处理，Acceptor线程用于接收网络请求，Processor线程用于建立网络连接和分发网络请求，Handler线程才是执行业务请求处理的线程，由Broker参数num.io.thread决定，数量越大执行线程越多，处理速度更快

(4)num.recovery.threads.per.data.dir：Broker重启后恢复线程数量，设置越大，追上数据进入ISR越快

(5)num.network.thread：The number of threads that the server uses for receiving requests from the network and sending responses to the network，增加这个线程参数就是提高收发网络请求的速度

(6)log.retention.bytes：日志保存时间，针对业务需求合理设置时间

(7)message.max.bytes：针对消息集合打包的大消息体业务，需要设置更大的参数

(8)num.replica.fetchers：副本数据同步线程，应当不超过cpu核数，通常设置为4-8即可

框架调优（Producer层面）

(1)消息发送确认机制：acks=all，通常情况下在生产环境设置为acks=1即Leader副本确认即可

(2)批量发送消息大小：batch.size= 发送到同一个分区消息的批次大小限制

(3)发送最大时延：linger.ms=,批量大小没有达到batch.size,最大允许时延

框架调优（Consumer层面）

(1)消息提交机制：如为保证消息不重复消费即手动提交消息

(2)消息数据批量大小：fetch.min.bytes，如果时延不敏感追求吞吐量，可设置得大一点

应用程序层面调优

(1)保证业务代码健壮性，保证容器不会出现过多bug导致反复重启诱发Kafka集群Rebalance

(2)不要频繁创建Producer和Consumer，建立的连接要Close；

(3)合理创建线程池进行连接复用

(4)合理利用多线程进行推送，消费消息

Kafka多维度调优的更多相关文章

DataPipeline ｜ApacheKafka实战作者胡夕：Apache Kafka监控与调优
https://baijiahao.baidu.com/s?id=1610644333184173190&wfr=spider&for=pc DataPipeline |ApacheK ...
Kafka的参数调优
这篇文章主要说一下在生产过程中的kafka常用的调优参数, 首先kafka的版本是0.9.0.1,针对以下几个方面来说, 针对kafka的堆内存: 针对kafka的集群调优: kafka的的消息机制有 ...
DataPipeline |《Apache Kafka实战》作者胡夕：Apache Kafka监控与调优
胡夕 <Apache Kafka实战>作者,北航计算机硕士毕业,现任某互金公司计算平台总监,曾就职于IBM.搜狗.微博等公司.国内活跃的Kafka代码贡献者. 前言虽然目前Apache ...
Kafka监控与调优
Kafka监控五个维度来监控Kafka 监控Kafka集群所在的主机监控Kafka broker JVM的表现监控Kafka Broker的性能监控Kafka客户端的性能.这里的所指的是广义的 ...
Spark踩坑记：Spark Streaming+kafka应用及调优
前言在WeTest舆情项目中,需要对每天千万级的游戏评论信息进行词频统计,在生产者一端,我们将数据按照每天的拉取时间存入了Kafka当中,而在消费者一端,我们利用了spark streaming从k ...
Kafka 集群调优
更多内容,前往 IT-BLOG 单个 kafka服务器足以满足本地开发或 POC要求,使用集群的最大好处是可以跨服务器进行负载均衡,再则就是可以使用复制功能来避免因单点故障造成的数据丢失.在维护 Ka ...
kafka消费服务调优
1.消费服务速度跟不上 2.top -H 观察是哪个线程最忙 3.多次使用jstack,看看最忙的那个线程在做什么
我的 Kafka 旅程 - 性能调优
Producer 于 config/producer.properties 配置文件中的项 # 序列化数据压缩方式 [none/gzip/snappy/lz4/zstd] compression.ty ...
《Kafka权威指南》读书笔记-操作系统调优篇
<Kafka权威指南>读书笔记-操作系统调优篇作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 大部分Linux发行版默认的内核调优参数配置已经能够满足大多数应用程序的运 ...
《Apache Kafka实战》读书笔记-调优Kafka集群
<Apache Kafka实战>读书笔记-调优Kafka集群作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.确定调优目标 1>.常见的非功能性要求一.性能( ...

随机推荐

技术实践第三期｜HashTag在Redis集群环境下的使用
简介:欢迎了解友盟+技术干货第三期内容:Redis集群环境如何按照前缀批量删除缓存.希望能对开发者们在实际应用中有所帮助. 一.背景数据源列表添加缓存支持,types字段可传多值,如app, mi ...
[Rust] 在 Linux 和 Mac 安装 Rust
首先,安装 rustup,这是一个 Rust 的安装程序. curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh cargo ...
WPF 触摸下如何给 StylusPointCollection 添加点
本文告诉大家如何在触摸下给 WPF 的 StylusPointCollection 添加新的点在自己默认创建的 StylusPointCollection 里面添加点是十分简单的,如以下代码,可以非 ...
WPF 双向绑定到非公开 set 方法属性在 NET 45 和 NET Core 行为的不同
本文记录 WPF 在 .NET Framework 4.5 和 .NET Core 3.0 或更高版本对使用 Binding 下的 TwoWay 双向绑定模式绑定到非公开的 set 属性上的行为变更 ...
02、Linux 排查
Linux 分析排查 1.敏感文件信息 1.1.tmp 目录 /tmp:临时目录文件,每个用户都可以对它进行读写操作.因此一个普通用户可以对 /tmp 目录执行读写操作(ls -alt) 筛查 /tm ...
C语言：约瑟夫问题——使用循环链表解决
传说有30个乘客同乘一条船,因为严重超载,加上风浪水作,危险万分.船长告诉乘客,只有将全船一半的乘客投入海中,其余人才能幸免于难.他们约定了一个规则:30个人围成一圈,由第一个人数起,依次报数,数到 ...
用 C 语言开发一门编程语言 — 字符串与文件加载
目录文章目录目录前文列表字符串读取字符串注释文件加载函数命令行参数打印函数报错函数源代码前文列表 <用 C 语言开发一门编程语言 - 交互式解析器> <用 C ...
Google出品的NotebookLM 人工智能笔记本，一款基于RAG的personalized AI产品
Google推出了实验性的NotebookLM产品,一款基于RAG的个性化AI助手产品,基于用户提供的可信信息,通过RAG,帮助用户洞察和学习参考内容,然后借助AI整理笔记,转换为用户最终需要的大纲. ...
一款开源的.NET程序集反编译、编辑和调试神器
前言说到.NET相关的反编译工具大家脑海里第一个想到的工具是什么?ILSpy.dnSpy.还是dotPeek?咱们今天的主要内容是讲讲dnSpyEx(dnSpyEx是dnSpy项目的非官方Fork维 ...
JDK动态代理的深入理解
引入代理模式代理模式是框架中经常使用的一种模式,动态代理是AOP(面向切面编程)思想的一种重要的实现方式,在我们常用的框架中也经常遇见代理模式的身影,例如在Spring中事务管理就运用了动态代理,它 ...

Kafka多维度调优

优化金字塔

操作系统调优

JVM层面调优

框架调优（Broker层面）

框架调优（Producer层面）

框架调优（Consumer层面）

应用程序层面调优

Kafka多维度调优的更多相关文章

随机推荐

热门专题