kafka删除topic数据
一、概述
生产环境中,有一个topic的数据量非常大。这些数据不是非常重要,需要定期清理。
要求:默认保持24小时,某些topic 需要保留2小时或者6小时

二、清除方式
主要有3个:
1. 基于时间
2. 基于日志大小
3. 基于日志起始偏移量
详情,请参考链接:
https://blog.csdn.net/u013256816/article/details/80418297
接下来,主要介绍基于时间的清除!
kafka版本为: 2.11-1.1.0
zk版本为: 3.4.13
三、kafka配置
# 启用删除主题
delete.topic.enable=true
# 检查日志段文件的间隔时间,以确定是否文件属性是否到达删除要求。
log.retention.check.interval.ms=
注意:这2行配置必须存在,否则清除策略失效!
log.retention.check.interval.ms 参数的单位是毫秒,这里表示间隔1秒钟
四、清除策略
全局topic
在 server.properties 文件中配置的是全局策略,针对每一个topic
比如:
log.retention.hours=
表示保留3个小时
单个topic
针对单个topic策略,需要使用脚本kafka-configs.sh
此脚本不需要重启kafka就会生效!
首先来查看一下,当前的topic策略,比如test
bin/kafka-configs.sh --zookeeper zookeeper-.default.svc.cluster.local: --describe --entity-type topics --entity-name test
参数解释:
--describe 详细信息
--entity-type 实体类型
--entity-name 指定topic名
输出:
Configs for topic 'test' are
这个表示为策略为空
删除topic数据
如果需要删除topic所有数据,使用命令
bin/kafka-topics.sh --delete --topic test --zookeeper zookeeper-.default.svc.cluster.local:
这个命令,请谨慎执行!!!
如果想保留主题,只删除主题现有数据(log)。可以通过修改数据保留时间实现
bin/kafka-configs.sh --zookeeper zookeeper-.default.svc.cluster.local: --entity-type topics --entity-name test --alter --add-config retention.ms=
执行输出:
Completed Updating config for entity: topic 'test'.
注意:修改保留时间为10秒钟,并不是10秒钟就马上删掉。kafka是采用轮询的方式,轮询到这个topic时,删除10秒钟前的数据。
时间由server.properties里面的log.retention.check.interval.ms选项为主
假设说 log.retention.check.interval.ms 值为1分钟,那么等待70秒,这个topic的数据就会自动被删除!
再次查看topic策略
bin/kafka-configs.sh --zookeeper zookeeper-.default.svc.cluster.local: --describe --entity-type topics --entity-name test
输出:
Configs for topic 'test' are retention.ms=
发现目前的删除策略为 retention.ms=10000
删除策略
如果需要删除上面的10秒策略,使用以下命令:
bin/kafka-configs.sh --zookeeper zookeeper-.default.svc.cluster.local: --entity-type topics --entity-name test --alter --delete-config retention.ms
输出:
Completed Updating config for entity: topic 'test'.
再次查看topic策略
bin/kafka-configs.sh --zookeeper zookeeper-.default.svc.cluster.local: --describe --entity-type topics --entity-name test
输出:
Configs for topic 'test' are
发现策略为空,说明删除成功了!
五、测试清除策略
测试思路

说明:
第一步,设置清除策略为保留10秒
第二步,进入生产者模式,输入消息 a
第三步,等待5秒,再次进入生产者模式,输入消息 b
第四部,进入消费者模式,看输出的消息是a还是b
判断标准:
在进行第三步时,a这条消息,应该已经被删除了。所以在第15秒进入消费者模式时,应该输出 b,这样的话,策略才是成功的!
设置策略
topic 为test的数据保留10秒
bin/kafka-configs.sh --zookeeper zookeeper-.default.svc.cluster.local: --entity-type topics --entity-name test --alter --add-config retention.ms=
生产模式
进入生产模式,输入a
bin/kafka-console-producer.sh --broker-list kafka-1.default.svc.cluster.local:9092 --topic test
> a
等待5秒后,再次进入生产模式,输入b
bin/kafka-console-producer.sh --broker-list kafka-1.default.svc.cluster.local:9092 --topic test
> b
消费者模式
等待5秒后,进入 消费者模式
bin/kafka-console-consumer.sh --bootstrap-server kafka-1.default.svc.cluster.local:9092 --topic test --from-beginning b
如果消费者输出为b,表示策略成功!
备注:
如果生产环境中,正在不断的进行生产和消费,执行kafka-configs.sh 脚本,是否会有影响呢?
答案是不会的,它是动态策略!
本文参考链接:
https://blog.csdn.net/forrest_ou/article/details/78999983
kafka删除topic数据的更多相关文章
- kafka 删除topic清空数据
原 kafka 删除topic清空数据 2018年11月20日 18:17:50 Ming! 阅读数:1391 版权声明:版权声明:本文为博主原创文章,未经博主允许不得转载. https://bl ...
- kafka删除topic及其相关数据
1.删除kafka存储目录(server.properties文件log.dirs配置,默认为"/tmp/kafka-logs")相关topic目录 2.Kafka 删除topic ...
- kafka删除topic的方法及我在kafka上边的一些经验
我在本地做kafka的producer调试,每隔一段时间后,所使用的topic管道就会堆积数据,而且我这边使用的是 kafka bin 下的consumer命令单独消费的,每次都是 --fro ...
- kafka 清除topic数据脚本
原 kafka 清除topic数据脚本 2018年07月25日 16:57:13 pete1223 阅读数:1028 #!/bin/sh param=$1 echo " ...
- kafka删除主题数据和删除主题
1.删除主题 在server.properties中增加设置,默认未开启 delete.topic.enable=true 删除主题命令 /bin/kafka-topics --delete --to ...
- kafka删除topic详解
1.删除topic命令 bin/kafka-topics.sh --delete --zookeeper 192.168.242.131:2181 --topic aaa 注:此命令如果要生效,还需在 ...
- kafka 删除topic
两种方法: 一.修改配置文件server.properties 添加如下配置: delete.topic.enable=true 说明:官方给的文档说明“Enables delete topic. D ...
- kafka删除topic中的数据,适用于比较高的版本
server.properties中增加选项 delete.topic.enable=true 修改之后重启kafka 进入kafka目录,输入命令 bin/kafka-topics.sh --zoo ...
- kafka删除topic
手动: 删除kafka存储目录(server.properties文件log.dirs配置,默认为"/tmp/kafka-logs")相关topic目录 删除zookeeper & ...
随机推荐
- Java基础-Eclipse第三方安装包管理工具之Maven
Java基础-Eclipse第三方安装包管理工具之Maven 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 玩过Linux的小伙伴应该都知道yum吧,我们只要把搭建好的yum仓库配 ...
- 11、JPA-JPQL
/** * JPQL,Java Persistence Query Language 的简称.是一种和 SQL 类似的中间性和对象化查询语言,它最终会被编译成针对不同底层数据库的 SQL 查询,从而屏 ...
- Hbase记录-Hbase其他工具
1.RowCounter工具可以查看某张表有多少行,效率非常高 2.count命令在数据量大的时候效率非常差 执行./hbase org.apache.hadoop.habse.mapreduce. ...
- 20155215 2016-2017-2 《Java程序设计》第9周学习总结
20155215 2016-2017-2 <Java程序设计>第9周学习总结 教材学习内容总结 第十六章 JDBC入门 - JDBC(Java DataBase Connectivity) ...
- Linux - openssl 加密
openssl rand 15 -base64 # 口令生成 openssl sha1 filename # 哈希算法校验文件 openssl md5 filename # MD5校验文件 opens ...
- chrome面板介绍
Chrome开发者工具详解(1):Elements.Console.Sources面板 Chrome 开发者工具详解(2):Network 面板 Chrome开发者工具详解(3):Timeline面板 ...
- 黑暗幽灵(DCM)木马详细分析
黑暗幽灵(DCM)木马详细分析 0x00 背景 只要插上网线或连上WIFI,无需任何操作,不一会儿电脑就被木马感染了,这可能吗?近期,腾讯反病毒实验室拦截到一个“黑暗幽灵”木马的新变种,该木马功能强大 ...
- Latex 公式居中
这么简单的功能要是还要加工具包,LaTeX也不用混了~ 公式用\[...\]来写可以达到公式居中效果. 或者在equation环境外加center环境: \begin{center} \begin{e ...
- 转载 - CNN感受野(receptive-fields)RF
本文翻译自A guide to receptive field arithmetic for Convolutional Neural Networks(可能需要FQ才能访问),方便自己学习和参考.若 ...
- SciPy模块应用
1.图像模糊 图像的高斯模糊是非常经典的图像卷积例子.本质上,图像模糊就是将(灰度)图像I 和一个高斯核进行卷积操作:,其中是标准差为σ的二维高斯核.高斯模糊通常是其他图像处理操作的一部分,比如图像 ...