[转帖]Kafka的Topic配置详解

https://www.jianshu.com/p/c9a54a587f0e

一、Kafka中topic级别配置

配置topic级别参数时，相同(参数)属性topic级别会覆盖全局的，否则默认为全局配置属性值。
创建topic参数可以设置一个或多个--config "Property(属性)",下面是创建一个topic名称为"my-topic"例子，它设置了2个参数max message size 和 flush rate.
(A)创建topic时配置参数

bin/kafka-topics.sh --zookeeper 192.168.2.225:2183/config/mobile/mq/mafka02 --create --topic my-topic --partitions 1   --replication-factor 1

--config max.message.bytes=64000 --config flush.messages=1

(B)修改topic时配置参数
覆盖已经有topic参数，下面例子修改"my-topic"的max message属性

bin/kafka-topics.sh --zookeeper192.168.2.225:2183/config/mobile/mq/mafka02  --alter --topic my-topic  --config max.message.bytes=128000

(C)删除topic级别配置参数

bin/kafka-topics.sh --zookeeper192.168.2.225:2183/config/mobile/mq/mafka02  --alter --topic my-topic  --delete-config max.message.bytes

注：配置的kafka集群的根目录为/config/mobile/mq/mafka02，因此所有节点信息都在此目录下。

二、Topic级别配置属性表

cleanup.policy

Default(默认值)：delete

server.properties：log.cleanup.policy

说明(解释)：日志清理策略选择有：delete和compact主要针对过期数据的处理，或是日志文件达到限制的额度，会被  topic创建时的指定参数覆盖

delete.retention.ms

Default(默认值)：86400000 (24 hours)

server.properties：log.cleaner.delete.retention.ms

说明(解释)：

对于压缩的日志保留的最长时间，也是客户端消费消息的最长时间，同log.retention.minutes的区别在于一个控制未压缩数据，一个控制压缩后的数据。会被topic创建时的指定参数覆盖

delete.retention.ms

Default(默认值)：86400000 (24 hours)

server.properties：log.cleaner.delete.retention.ms

说明(解释)：

对于压缩的日志保留的最长时间，也是客户端消费消息的最长时间，同log.retention.minutes的区别在于一个控制未压缩数据，一个控制压缩后的数据。会被topic创建时的指定参数覆盖

flush.messages

Default(默认值)：None

server.properties：log.flush.interval.messages

说明(解释)：

log文件”sync”到磁盘之前累积的消息条数,因为磁盘IO操作是一个慢操作,但又是一个”数据可靠性"的必要手段,所以此参数的设置,需要在"数据可靠性"与"性能"之间做必要的权衡.如果此值过大,将会导致每次"fsync"的时间较长(IO阻塞),如果此值过小,将会导致"fsync"的次数较多,这也意味着整体的client请求有一定的延迟.物理server故障,将会导致没有fsync的消息丢失.

flush.ms

Default(默认值)：None

server.properties：log.flush.interval.ms

说明(解释)：仅仅通过interval来控制消息的磁盘写入时机,是不足的.此参数用于控制"fsync"的时间间隔,如果消息量始终没有达到阀值,但是离上一次磁盘同步的时间间隔达到阀值,也将触发.

index.interval.bytes

Default(默认值)：4096

server.properties：log.index.interval.bytes

说明(解释)：当执行一个fetch操作后，需要一定的空间来扫描最近的offset大小，设置越大，代表扫描速度越快，但是也更好内存，一般情况下不需要搭理这个参数

message.max.bytes

Default(默认值)：1,000,000

server.properties：  表示消息的最大大小，单位是字节

说明(解释)：当执行一个fetch操作后，需要一定的空间来扫描最近的offset大小，设置越大，代表扫描速度越快，但是也更好内存，一般情况下不需要搭理这个参数

min.cleanable.dirty.ratio

Default(默认值)：0.5

server.properties：log.cleaner.min.cleanable.ratio

说明(解释)：日志清理的频率控制，越大意味着更高效的清理，同时会存在一些空间上的浪费，会被topic创建时的指定参数覆盖

retention.bytes

Default(默认值)：None

server.properties：log.retention.bytes

说明(解释)：

topic每个分区的最大文件大小，一个topic的大小限制  = 分区数*log.retention.bytes。-1没有大小限log.retention.bytes和log.retention.minutes任意一个达到要求，都会执行删除，会被topic创建时的指定参数覆盖

retention.ms

Default(默认值)：None

server.properties：log.retention.minutes

说明(解释)：

数据存储的最大时间超过这个时间会根据log.cleanup.policy设置的策略处理数据，也就是消费端能够多久去消费数据

log.retention.bytes和log.retention.minutes达到要求，都会执行删除，会被topic创建时的指定参数覆盖

segment.bytes

Default(默认值)：1 GB

server.properties：log.segment.bytes

说明(解释)：

topic的分区是以一堆segment文件存储的，这个控制每个segment的大小，会被topic创建时的指定参数覆盖

segment.index.bytes

Default(默认值)：10 MB

server.properties：log.index.size.max.bytes

说明(解释)：对于segment日志的索引文件大小限制，会被topic创建时的指定参数覆盖

log.roll.hours

Default(默认值)：7 days

server.properties：log.index.size.max.bytes

说明(解释)： 这个参数会在日志segment没有达到log.segment.bytes设置的大小，也会强制新建一个segment会被  topic创建时的指定参数覆盖