kafka 客户端 producer 配置参数

属性	描述	类型	默认值
bootstrap.servers	用于建立与kafka集群的连接，这个list仅仅影响用于初始化的hosts，来发现全部的servers。格式：host1:port1,host2:port2,…，数量尽量不止一个，以防其中一个down了	list
acks	Server完成 producer request 前需要确认的数量。 `acks=0`时，producer不会等待确认，直接添加到socket等待发送； `acks=1`时，等待leader写到local log就行； `acks=all`或`acks=-1`时，等待isr中所有副本确认（注意：确认都是 broker 接收到消息放入内存就直接返回确认，不是需要等待数据写入磁盘后才返回确认，这也是kafka快的原因）	string	1
buffer.memory	Producer可以用来缓存数据的内存大小。该值实际为RecordAccumulator类中的BufferPool，即Producer所管理的最大内存。如果数据产生速度大于向broker发送的速度，producer会阻塞`max.block.ms`，超时则抛出异常	long	33554432
compression.type	Producer用于压缩数据的压缩类型，取值：`none, gzip, snappy, or lz4`	string	none
batch.size	Producer可以将发往同一个Partition的数据做成一个Produce Request发送请求，即Batch批处理，以减少请求次数，该值即为每次批处理的大小。另外每个Request请求包含多个Batch，每个Batch对应一个Partition，且一个Request发送的目的Broker均为这些partition的leader副本。若将该值设为0，则不会进行批处理	int	16384
linger.ms	Producer默认会把两次发送时间间隔内收集到的所有Requests进行一次聚合然后再发送，以此提高吞吐量，而linger.ms则更进一步，这个参数为每次发送增加一些delay，以此来聚合更多的Message。官网解释翻译：producer会将request传输之间到达的所有records聚合到一个批请求。通常这个值发生在欠负载情况下，record到达速度快于发送。但是在某些场景下，client即使在正常负载下也期望减少请求数量。这个设置就是如此，通过人工添加少量时延，而不是立马发送一个record，producer会等待所给的时延，以让其他records发送出去，这样就会被聚合在一起。这个类似于TCP的Nagle算法。该设置给了batch的时延上限：当我们获得一个partition的`batch.size`大小的records，就会立即发送出去，而不管该设置；但是如果对于这个partition没有累积到足够的record，会`linger`指定的时间等待更多的records出现。该设置的默认值为0(无时延)。例如，设置`linger.ms=5`，会减少request发送的数量，但是在无负载下会增加5ms的发送时延。	long	0
max.request.size	请求的最大字节数。这也是对最大消息大小的有效限制。注意：server具有自己对消息大小的限制，这些大小和这个设置不同。此项设置将会限制producer每次批量发送请求的数目，以防发出巨量的请求。	int	1048576
receive.buffer.bytes	TCP的接收缓存 SO_RCVBUF 空间大小，用于读取数据	int	32768
request.timeout.ms	client等待请求响应的最大时间,如果在这个时间内没有收到响应，客户端将重发请求，超过重试次数发送失败	int	30000
send.buffer.bytes	TCP的发送缓存 SO_SNDBUF 空间大小，用于发送数据	int	131072
timeout.ms	指定server等待来自followers的确认的最大时间，根据`acks`的设置，超时则返回error	int	30000
max.in.flight.requests.per.connection	在block前一个connection上允许最大未确认的requests数量。当设为1时，即是消息保证有序模式，注意：这里的消息保证有序是指对于单个Partition的消息有顺序，因此若要保证全局消息有序，可以只使用一个Partition，当然也会降低性能	int	5
metadata.fetch.timeout.ms	在第一次将数据发送到某topic时，需先fetch该topic的metadata，得知哪些服务器持有该topic的partition，该值为最长获取metadata时间	long	60000
reconnect.backoff.ms	连接失败时，当我们重新连接时的等待时间	long	50
retry.backoff.ms	在重试发送失败的request前的等待时间，防止若目的Broker完全挂掉的情况下Producer一直陷入死循环发送，折中的方法	long	100

其余参数（注：以下均为默认值）

# metrics系统维护可配置的样本数量，在一个可修正的window size
metrics.sample.window.ms=30000

# 用于维护metrics的样本数
metrics.num.samples=2

# 类的列表，用于衡量指标。实现MetricReporter接口
metric.reporters=[]

# 强制刷新metadata的周期，即使leader没有变化
metadata.max.age.ms=300000

# 与broker会话协议，取值：LAINTEXT, SSL, SASL_PLAINTEXT, SASL_SSL
security.protocol=PLAINTEXT

# 分区类，实现Partitioner接口
partitioner.class=class org.apache.kafka.clients.producer.internals.DefaultPartitioner

# 控制block的时长，当buffer空间不够或者metadata丢失时产生block
max.block.ms=60000

# 关闭达到该时间的空闲连接
connections.max.idle.ms=540000

# 当向server发出请求时，这个字符串会发送给server，目的是能够追踪请求源
client.id=""

# 发生错误时，重传次数。当开启重传时，需要将`max.in.flight.requests.per.connection`设置为1，否则可能导致失序
retries=0

# key 序列化方式，类型为class，需实现Serializer interface
key.serializer=

# value 序列化方式，类型为class，需实现Serializer interface
value.serializer=

kafka 客户端 producer 配置参数的更多相关文章

kafka 客户端 consumer 配置参数
1.Consumer Group 与 topic 订阅每个Consumer 进程都会划归到一个逻辑的Consumer Group中,逻辑的订阅者是Consumer Group.所以一条message ...
【转】详解Kafka生产者Producer配置
粘贴一下这个配置,与我自己的程序做对比,看看能不能完善我的异步带代码: ----------------------------------------- 详解Kafka生产者Produce ...
Kafka客户端Producer与Consumer
Kafka客户端Producer与Consumer 一.pom.xml 二.相关配置文件 producer.properties log4j.properties base.properties 三. ...
【Kafka】Producer配置
名称描述类型默认值 bootstrap.servers kafka集群地址,ip+端口,以逗号隔开.不管这边配置的是什么服务器,客户端会使用所有的服务器.配置的列表只会影响初始发现所有主机.配置 ...
Kafka 0.8 配置参数解析
http://kafka.apache.org/documentation.html#configuration Broker Configs 4个必填参数, broker.id Each bro ...
kafka配置参数
Kafka为broker,producer和consumer提供了很多的配置参数. 了解并理解这些配置参数对于我们使用kafka是非常重要的.本文列出了一些重要的配置参数. 官方的文档 Configu ...
Kafka 配置参数汇总及相关说明
Kafka为broker,producer和consumer提供了很多的配置参数. 了解并理解这些配置参数对于我们使用kafka是非常重要的.本文列出了一些重要的配置参数. 官方的文档 Configu ...
如何创建Kafka客户端：Avro Producer和Consumer Client
1.目标 - Kafka客户端在本文的Kafka客户端中,我们将学习如何使用Kafka API 创建Apache Kafka客户端.有几种方法可以创建Kafka客户端,例如最多一次,至少一次,以及一 ...

随机推荐

(二分查找拓展) leetcode 162. Find Peak Element && lintcode 75. Find Peak Element
A peak element is an element that is greater than its neighbors. Given an input array nums, where nu ...
HDFS概述
HDFS概述作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.HDFS产出背景及定义 1>.HDFS产生背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配 ...
Docker安装rabbitmq
前面的文章中我们的docker已经安装好了,我的最终目的是用docker来安装rabbitmq,所以本文我记录一下我用docker安装rabbitmq的过程: 1.下载镜像(下载management的 ...
HBase LSM树存储引擎详解
1.前提讲LSM树之前,需要提下三种基本的存储引擎,这样才能清楚LSM树的由来: 哈希存储引擎. B树存储引擎. LSM树(Log-Structured Merge Tree)存储引擎. 2. 哈希 ...
记一次线上Java程序导致服务器CPU占用率过高的问题排除过程
博文转至:http://www.jianshu.com/p/3667157d63bb,转本博文的目的就是需要的时候以防忘记 1.故障现象客服同事反馈平台系统运行缓慢,网页卡顿严重,多次重启系统后问题 ...
socket.io emit callback调用探秘
socket.io https://socket.io/ https://socket.io/docs/ What Socket.IO is Socket.IO is a library that e ...
[Deep Learning] 深度学习中消失的梯度
好久没有更新blog了,最近抽时间看了Nielsen的<Neural Networks and Deep Learning>感觉小有收获,分享给大家. 了解深度学习的同学可能知道,目前深度 ...
JdLibrary 的使用
写一个类 public class Init { public static void InitAssembly() { JdLibrary.JdEx.Excepteion = Object(new ...
python复习1
比如常用的数学常数π就是一个常量.在Python中,通常用全部大写的变量名表示常量: Python支持多种数据类型,在计算机内部,可以把任何数据都看成一个“对象”,而变量就是在程序中用来指向这些数据对 ...
day 23-1 类的命名空间、组合
类的命名空间类与对象命名空间类里可以定义两种属性静态属性动态属性类中的静态变量可以被对象和类调用对于不可变数据类型来说,类变量最好用类名操作对于可变数据类型来说,对象名的修改是共享的,重 ...

kafka 客户端 producer 配置参数

kafka 客户端 producer 配置参数的更多相关文章

随机推荐

热门专题