我的 Kafka 旅程 - 性能调优

Producer

于 config/producer.properties 配置文件中的项

# 序列化数据压缩方式 [none/gzip/snappy/lz4/zstd]

compression.type = snappy			# default=none

# 内存队列缓冲区总大小

buffer.memory = 67108864			# default=32M

# 数据块/批次 单个大小

batch.size = 32768				# default=16K

# 数据块/批次 过期毫秒

linger.ms = 5					# default=0

# Broker 分区的应答机制

acks = 1					# default=all

# 发送请求允许最大的积压数

max.in.flight.requests.per.connection = 5	# default=5

# 发送失败的重试次数

retries = 2147483647				# default=0

# 发送失败重试间隔毫秒

retry.backoff.ms = 100				# default=100ms

# 幂等性（生产者编号 + Broker分区编号 + 消息编号）

enable.idempotence = true			# default=true

Broker

于 config/server.properties 配置文件中的项

# 数据写磁盘线程数（占总核心数60%）

num.io.threads = 8				# default=8

# 副本主动拉取线程数（占总核心数10%）

num.replica.fetchers = 1			# default=1

# 数据网络传输线程数（占总核心数30%）

num.network.threads = 3				# default=3

# 不存在的Topic自动创建

auto.create.topics.enable = true		# default=true

# 副本通信超时

replica.lag.time.max.ms = 30000			# default=30000

# Broker leader partition 分区再平衡

auto.leader.rebalance.enable = true		# default=true

# 再平衡警戒值(%)

leader.imbalance.per.broker.percentage = 1	# default=10

# 再平衡检测间隔秒数

leader.imbalance.check.interval.seconds = 300	# default=300

# 数据分片单文件大小

log.segment.bytes = 1073741824			# default=1GB

# 数据每索引范围大小

log.index.interval.bytes = 4096			# default=4KB

# 数据保留时长

log.retention.hours = 168			# default=168 (7天)

# 数据保留分钟

log.retention.minutes				# default=null

# 数据保留毫秒

log.retention.ms				# default=null

# 数据保留检测间隔

log.retention.check.interval.ms = 300000	# default=300000

# 数据保留总大小

log.retention.bytes = -1			# default=-1 (无穷大)

# 数据删除策略 [compact,delete]

log.cleanup.policy = delete			# default=delete

Consumer

于 config/consumer.properties 配置文件中的项

# 自动提交消费偏移量

enable.auto.commit = true		# default=true

# 提交消费偏移量频率间隔

auto.commit.interval.ms = 5000		# default=5000

# 缺少偏移量的处理 [latest,earliest,none]

auto.offset.reset = latest		# default=latest

# 分区数

offsets.topic.num.partitions = 50	# default=50

# 与Broker间的心跳间隔

heartbeat.interval.ms = 5000		# default=3000

# 与Broker间的超时

session.timeout.ms = 45000		# default=45000

# 消息处理最大时长

max.poll.interval.ms = 300000		# default=300000

# 单次拉取数据大小

fetch.max.bytes = 57671680		# default=50M

# 单次拉取数据最大条数

max.poll.records = 500			# default=500

# 再平衡策略				# default= Range + CooperativeSticky

partition.assignment.strategy = class...RangeAssignor,class...CooperativeStickyAssignor

整体吞吐量

生产者

buffer.memory：增加内存缓冲区
batch.size：增加单数据块/批次容量
linger.ms：消息发送延迟5毫秒
compression.type：开启压缩

Broker

增加分区数（按分类分区）并行处理

消费者

fetch.max.bytes：每次消费数据最大容量
max.poll.recodes：每次消费数据最大条数

数据精确一次

生产者：acks = all，幂等性 + 事务

Broker：分区副本至少大于2，防丢失

消费者：手动提交offset + 事务

我的 Kafka 旅程 - 性能调优的更多相关文章

【Kafka】Kafka-副本-分区设置-性能调优
Kafka-副本-分区设置-性能调优 SparkKafkaDemo - Executors kafka replication 负载均衡_百度搜索 Kafka 高性能吞吐揭秘 - 友盟博客 - Seg ...
Kafka跨集群迁移方案MirrorMaker原理、使用以及性能调优实践
序言Kakfa MirrorMaker是Kafka 官方提供的跨数据中心的流数据同步方案.其实现原理,其实就是通过从Source Cluster消费消息然后将消息生产到Target Cluster,即 ...
Kafka性能调优 - Kafka优化的方法
今天,我们将讨论Kafka Performance Tuning.在本文“Kafka性能调优”中,我们将描述在设置集群配置时需要注意的配置.此外,我们将讨论Tuning Kafka Producers ...
Spark Streaming性能调优详解
Spark Streaming性能调优详解 Spark 2015-04-28 7:43:05 7896℃ 0评论分享到微博下载为PDF 2014 Spark亚太峰会会议资料下载.< ...
Spark Streaming性能调优详解（转）
原文链接:Spark Streaming性能调优详解 Spark Streaming提供了高效便捷的流式处理模式,但是在有些场景下,使用默认的配置达不到最优,甚至无法实时处理来自外部的数据,这时候我们 ...
《Tomcat和JVM的性能调优你真的学会了吗？》总结篇
Tomcat性能调优: 找到Tomcat根目录下的conf目录,修改server.xml文件的内容.对于这部分的调优,我所了解到的就是无非设置一下Tomcat服务器的最大并发数和Tomcat初始化时创 ...
storm杂记+性能调优
1.默认情况下: 1个supervisor节点启动4个worker进程. 每一个topology默认占用一个worker进程. 每个worker会启动executor. 每个executor默认启动一 ...
ElasticSearch中的JVM性能调优
ElasticSearch中的JVM性能调优前一段时间被人问了个问题:在使用ES的过程中有没有做过什么JVM调优措施? 在我搭建ES集群过程中,参照important-settings官方文档来的, ...
DataPipeline ｜ApacheKafka实战作者胡夕：Apache Kafka监控与调优
https://baijiahao.baidu.com/s?id=1610644333184173190&wfr=spider&for=pc DataPipeline |ApacheK ...

随机推荐

.net 温故知新：【6】Linq是什么
1.什么是Linq 关于什么是Linq 我们先看看这段代码. List<int> list = new List<int> { 1, 1, 2, 2, 3, 3, 3, 5, ...
YII学习总结5（视图）
<?php namespace app\controllers; use yii\web\Controller; class HelloController extends Controller ...
妙用 CSS 构建花式透视背景效果
本文将介绍一种巧用 background 配合 backdrop- filter 来构建有趣的透视背景效果的方式. 本技巧源自于一名群友的提问,如何构建如 ElementUI 文档的一种顶栏背景特效, ...
2019国家集训队论文《整点计数》命题报告学习笔记/Min25
\(2019\)国家集训队论文<整点计数>命题报告学习笔记/\(Min25\) 补了个大坑看了看提交记录,发现\(hz\)的\(xdm\)早过了... 前置知识,\(HAOI\)< ...
fijkplayer问题反馈：暂停时拖动进度光标，在窗口模式与全屏模式间切换后，进度光标不能及时更新、正常跟进
fijkplayer-0.8.4很优秀,造福苍生,非常感谢! 使用fijkplayer-0.8.4开发的过程中遇到以下问题,特此记录.提交上传:https://github.com/befovy/fi ...
Luogu2073 送花（平衡树）
打感叹号处为傻逼处 #include <iostream> #include <cstdio> #include <cstring> #include <al ...
mybatis-plus 生成全套crud
pom依赖:  <dependency> <groupId>org.springframework.boot</groupId> ...
这次我设计了一款TPS百万级别的分布式、高性能、可扩展的RPC框架
作者:冰河博客地址:https://binghe001.github.io 大家好,我是冰河~~ 没错,这次冰河又要搞事情了,这次准备下手的是RPC框架项目.为什么要对RPC框架项目下手呢,因为在如 ...
学军中学第三届“图灵杯”趣味网络邀请赛——中级T4.欧拉回路（图论，哈希）
题面补题链接 7 5 6 7 1 2 3 3 13 5 30 50 10 30 70 8 题解存在欧拉回路的条件是:1. 每个点的度数都是偶数.2. 有边的连通块最多一个. 数据范围是允许我们 n ...
Codeforces Round #585 (Div. 2) E. Marbles （状压DP），BZOJ大理石（同一道题）题解
题意林老师是一位大理石收藏家,他在家里收藏了n块各种颜色的大理石,第i块大理石的颜色为ai.但是林老师觉得这些石头在家里随意摆放太过凌乱,他希望把所有颜色相同的石头放在一起.换句话说,林老师需要对现 ...

我的 Kafka 旅程 - 性能调优

Producer

Broker

Consumer

整体吞吐量

生产者

Broker

消费者

数据精确一次

我的 Kafka 旅程 - 性能调优的更多相关文章

随机推荐

热门专题