我的 Kafka 旅程 - 性能调优

Producer

于 config/producer.properties 配置文件中的项

# 序列化数据压缩方式 [none/gzip/snappy/lz4/zstd]

compression.type = snappy			# default=none

# 内存队列缓冲区总大小

buffer.memory = 67108864			# default=32M

# 数据块/批次 单个大小

batch.size = 32768				# default=16K

# 数据块/批次 过期毫秒

linger.ms = 5					# default=0

# Broker 分区的应答机制

acks = 1					# default=all

# 发送请求允许最大的积压数

max.in.flight.requests.per.connection = 5	# default=5

# 发送失败的重试次数

retries = 2147483647				# default=0

# 发送失败重试间隔毫秒

retry.backoff.ms = 100				# default=100ms

# 幂等性（生产者编号 + Broker分区编号 + 消息编号）

enable.idempotence = true			# default=true

Broker

于 config/server.properties 配置文件中的项

# 数据写磁盘线程数（占总核心数60%）

num.io.threads = 8				# default=8

# 副本主动拉取线程数（占总核心数10%）

num.replica.fetchers = 1			# default=1

# 数据网络传输线程数（占总核心数30%）

num.network.threads = 3				# default=3

# 不存在的Topic自动创建

auto.create.topics.enable = true		# default=true

# 副本通信超时

replica.lag.time.max.ms = 30000			# default=30000

# Broker leader partition 分区再平衡

auto.leader.rebalance.enable = true		# default=true

# 再平衡警戒值(%)

leader.imbalance.per.broker.percentage = 1	# default=10

# 再平衡检测间隔秒数

leader.imbalance.check.interval.seconds = 300	# default=300

# 数据分片单文件大小

log.segment.bytes = 1073741824			# default=1GB

# 数据每索引范围大小

log.index.interval.bytes = 4096			# default=4KB

# 数据保留时长

log.retention.hours = 168			# default=168 (7天)

# 数据保留分钟

log.retention.minutes				# default=null

# 数据保留毫秒

log.retention.ms				# default=null

# 数据保留检测间隔

log.retention.check.interval.ms = 300000	# default=300000

# 数据保留总大小

log.retention.bytes = -1			# default=-1 (无穷大)

# 数据删除策略 [compact,delete]

log.cleanup.policy = delete			# default=delete

Consumer

于 config/consumer.properties 配置文件中的项

# 自动提交消费偏移量

enable.auto.commit = true		# default=true

# 提交消费偏移量频率间隔

auto.commit.interval.ms = 5000		# default=5000

# 缺少偏移量的处理 [latest,earliest,none]

auto.offset.reset = latest		# default=latest

# 分区数

offsets.topic.num.partitions = 50	# default=50

# 与Broker间的心跳间隔

heartbeat.interval.ms = 5000		# default=3000

# 与Broker间的超时

session.timeout.ms = 45000		# default=45000

# 消息处理最大时长

max.poll.interval.ms = 300000		# default=300000

# 单次拉取数据大小

fetch.max.bytes = 57671680		# default=50M

# 单次拉取数据最大条数

max.poll.records = 500			# default=500

# 再平衡策略				# default= Range + CooperativeSticky

partition.assignment.strategy = class...RangeAssignor,class...CooperativeStickyAssignor

整体吞吐量

生产者

buffer.memory：增加内存缓冲区
batch.size：增加单数据块/批次容量
linger.ms：消息发送延迟5毫秒
compression.type：开启压缩

Broker

增加分区数（按分类分区）并行处理

消费者

fetch.max.bytes：每次消费数据最大容量
max.poll.recodes：每次消费数据最大条数

数据精确一次

生产者：acks = all，幂等性 + 事务

Broker：分区副本至少大于2，防丢失

消费者：手动提交offset + 事务

我的 Kafka 旅程 - 性能调优的更多相关文章

【Kafka】Kafka-副本-分区设置-性能调优
Kafka-副本-分区设置-性能调优 SparkKafkaDemo - Executors kafka replication 负载均衡_百度搜索 Kafka 高性能吞吐揭秘 - 友盟博客 - Seg ...
Kafka跨集群迁移方案MirrorMaker原理、使用以及性能调优实践
序言Kakfa MirrorMaker是Kafka 官方提供的跨数据中心的流数据同步方案.其实现原理,其实就是通过从Source Cluster消费消息然后将消息生产到Target Cluster,即 ...
Kafka性能调优 - Kafka优化的方法
今天,我们将讨论Kafka Performance Tuning.在本文“Kafka性能调优”中,我们将描述在设置集群配置时需要注意的配置.此外,我们将讨论Tuning Kafka Producers ...
Spark Streaming性能调优详解
Spark Streaming性能调优详解 Spark 2015-04-28 7:43:05 7896℃ 0评论分享到微博下载为PDF 2014 Spark亚太峰会会议资料下载.< ...
Spark Streaming性能调优详解（转）
原文链接:Spark Streaming性能调优详解 Spark Streaming提供了高效便捷的流式处理模式,但是在有些场景下,使用默认的配置达不到最优,甚至无法实时处理来自外部的数据,这时候我们 ...
《Tomcat和JVM的性能调优你真的学会了吗？》总结篇
Tomcat性能调优: 找到Tomcat根目录下的conf目录,修改server.xml文件的内容.对于这部分的调优,我所了解到的就是无非设置一下Tomcat服务器的最大并发数和Tomcat初始化时创 ...
storm杂记+性能调优
1.默认情况下: 1个supervisor节点启动4个worker进程. 每一个topology默认占用一个worker进程. 每个worker会启动executor. 每个executor默认启动一 ...
ElasticSearch中的JVM性能调优
ElasticSearch中的JVM性能调优前一段时间被人问了个问题:在使用ES的过程中有没有做过什么JVM调优措施? 在我搭建ES集群过程中,参照important-settings官方文档来的, ...
DataPipeline ｜ApacheKafka实战作者胡夕：Apache Kafka监控与调优
https://baijiahao.baidu.com/s?id=1610644333184173190&wfr=spider&for=pc DataPipeline |ApacheK ...

随机推荐

【跟着大佬学JavaScript】之数组去重（结果对比）
前言数组去重在面试和工作中都是比较容易见到的问题. 这篇文章主要是来测试多个方法,对下面这个数组的去重结果进行分析讨论.如果有不对的地方,还请大家指出. const arr = [ 1, 1, &q ...
TCP/IP协议三次握手、四次断开
1.tcp报文格式 1行代表一个字节: 第一行:代表源端口和目的端口,分别占16位: 第二行:32位序列号:表示客户端向服务端发送的报文的序号是多少,这个序号是计算机随机生成的一个代表该报文的唯一标示 ...
零基础学Java（12）静态字段与静态方法
静态字段与静态方法之前我们都定义的main方法都被标记了static修饰符,那到底是什么意思?下面我们来看看静态字段如果将一个字段定义为static,每个类只有一个这样的字段.而对于非静 ...
HTML js 复习
<a href="#top" target="_self">返回顶部</a> 返回页面顶部代码打印js对象方法 function wr ...
Docker 07 部署Tomcat
参考源 https://www.bilibili.com/video/BV1og4y1q7M4?spm_id_from=333.999.0.0 https://www.bilibili.com/vid ...
读取图片文件MetaFile放入Windows剪切板
前言前段时间群里有个小伙在工作中遇到一个问题,透明的图片存入剪切板在粘贴到adobe PDF中出现不透明问题但是粘贴到Excel可以,还有就是从excel复制再粘贴到PDF也是可以.小伙在群里发了两 ...
WPF开发快速入门【7】WPF的拖放功能（Drag and Drop）
概述本文描述WPF的拖放功能(Drag and Drop). 拖放功能涉及到两个功能,一个就是拖,一个是放.拖放可以发生在两个控件之间,也可以在一个控件自己内部拖放.假设界面上有两个控件,一个Tre ...
【java】学习路径29-异常捕捉实例
import java.util.ArrayList;public class ExceptionCatchDemo { public static void main(String[] args) ...
kubeadm部署k8s v1.19.4版本集群
1. 准备2台2c4g虚机配置地址192.168.198.144,192.168.198.146,一台作为master,一台作为node 2. 部署环境准备,每一台虚机都需要操作 # 关闭防火墙sy ...
并发与并行,同步和异步,Go lang1.18入门精炼教程，由白丁入鸿儒，Go lang并发编程之GoroutineEP13
如果说Go lang是静态语言中的皇冠,那么,Goroutine就是并发编程方式中的钻石.Goroutine是Go语言设计体系中最核心的精华,它非常轻量,一个 Goroutine 只占几 KB,并且这 ...

我的 Kafka 旅程 - 性能调优

Producer

Broker

Consumer

整体吞吐量

生产者

Broker

消费者

数据精确一次

我的 Kafka 旅程 - 性能调优的更多相关文章

随机推荐

热门专题