kafka auto.offset.reset参数解析

1.latest和earliest区别
2.创建topic
3.生产数据和接收生产数据
4.测试代码

auto.offset.reset关乎kafka数据的读取。常用的二个值是latest和earliest，默认是latest。

如果kafka只接收数据，从来没来消费过，程序一开始不要用latest，不然以前的数据就接收不到了。应当先earliest，然后二都都可以。

earliest

当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，从头开始消费

latest

当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，消费新产生的该分区下的数据

none

topic各分区都存在已提交的offset时，从offset后开始消费；只要有一个分区不存在已提交的offset，则抛出异常

1.latest和earliest区别

earliest 当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，从头开始消费
latest 当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，消费新产生的该分区下的数据

提交过offset，latest和earliest没有区别，但是在没有提交offset情况下，用latest直接会导致无法读取旧数据。

2.创建topic

# bin/kafka-topics.sh --create --zookeeper bigserver1:2181,bigserver2:2181,testing:2181 --replication-factor 2 --partitions 3 --topic tank

Created topic "tank".  

# bin/kafka-topics.sh --describe --zookeeper bigserver1:2181,bigserver2:2181,testing:2181 --topic tank

Topic:tank PartitionCount:3 ReplicationFactor:2 Configs:

 Topic: tank Partition: 0 Leader: 0 Replicas: 0,2 Isr: 0,2

 Topic: tank Partition: 1 Leader: 1 Replicas: 1,0 Isr: 1,0

 Topic: tank Partition: 2 Leader: 2 Replicas: 2,1 Isr: 2,1

3.生产数据和接收生产数据

[root@bigserver1 kafka]# bin/kafka-console-producer.sh --broker-list bigserver1:9092,bigserver2:9092,testing:9092 --topic tank

>1

>2

>3

。。。。。。。。。省略。。。。。。。。。

[root@bigserver1 kafka]# bin/kafka-console-consumer.sh --bootstrap-server bigserver1:9092,bigserver2:9092,testing:9092 --topic tank --from-beginning

1

2

3

4.测试代码

object tank {

    def main(args: Array[String]): Unit = {

        val pros: Properties = new Properties

        pros.put("bootstrap.servers", "bigserver1:9092,bigserver2:9092,testing:9092")

        /*分组由消费者决定,完全自定义,没有要求*/

        pros.put("group.id", "tank")

        //设置为true 表示offset自动托管到kafka内部的一个特定名称为__consumer_offsets的topic

        pros.put("enable.auto.commit", "false")

        pros.put("auto.commit.interval.ms", "1000")

        pros.put("max.poll.records", "5")

        pros.put("session.timeout.ms", "30000")

        //只有当offset不存在的时候，才用latest或者earliest

        pros.put("auto.offset.reset", "latest")  

        pros.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer")

        pros.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer")  

        val consumer: KafkaConsumer[String, String] = new KafkaConsumer[String, String](pros)  

        /*这里填写主题名称*/

        consumer.subscribe(util.Arrays.asList("tank"))  

        val system = akka.actor.ActorSystem("system")

        system.scheduler.schedule(0 seconds, 30 seconds)(tankTest.saveData(args,consumer))  

    }  

    object tankTest {

        def saveData(args: Array[String],consumer: KafkaConsumer[String,String]): Unit = {

            val records: ConsumerRecords[String, String] = consumer.poll(Duration.ofSeconds(3))

            if (!records.isEmpty) {

                for (record <- records) {

                    if (record.value != null && !record.value.equals("")) {

                        myLog.syncLog(record.value + "\t准备开启消费者出列数据", "kafka", "get")

                    }

                }

                consumer.commitSync()  

            }  

        }

    }

}

kafka auto.offset.reset参数解析的更多相关文章

Kafka auto.offset.reset
要从头消费kafka的数据,可以通过以下参数: Kafka auto.offset.reset = earliest
kafka之consumer参数auto.offset.reset 0.10+
https://blog.csdn.net/dingding_ting/article/details/84862776 https://blog.csdn.net/xianpanjia4616/ar ...
kafka的auto.offset.reset详解与测试
1. 取值及定义 auto.offset.reset有以下三个可选值: latest (默认) earliest none 三者均有共同定义: 对于同一个消费者组,若已有提交的offset,则从提交的 ...
Kafka 0.8 配置参数解析
http://kafka.apache.org/documentation.html#configuration Broker Configs 4个必填参数, broker.id Each bro ...
kafka_2.11-0.10.2.1中的auto.offset.reset
在使用spark连接kafka消费topic时,发现无论怎么设置,也无法从头开始消费. 查看配置得出auto.offset.reset的以下3种设置及含义: earliest 当各分区下有已提交的of ...
kafka Auto offset commit faild reblance
今天在使用python消费kafka时遇到了一些问题, 特记录一下. 场景一. 特殊情况: 单独写程序只用来生产消费数据开始时间: 10:42 Topic: t_facedec Partition: ...
Kafka单线程Consumer及参数详解
请使用0.9以后的版本: 示例代码 Properties props = new Properties(); props.put("bootstrap.servers", &quo ...
「Kafka」Kafka中offset偏移量提交
在消费Kafka中分区的数据时,我们需要跟踪哪些消息是读取过的.哪些是没有读取过的.这是读取消息不丢失的关键所在. Kafka是通过offset顺序读取事件的.如果一个消费者退出,再重启的时候,它知道 ...
kafka 客户端 consumer 配置参数
1.Consumer Group 与 topic 订阅每个Consumer 进程都会划归到一个逻辑的Consumer Group中,逻辑的订阅者是Consumer Group.所以一条message ...

随机推荐

Android ADB原理及常用命令
Android调试桥(ADB, Android Debug Bridge)是一个Android命令行工具,包含在SDK 平台工具包中,adb可以用于连接Android设备,或者模拟器,实现对设备的控制 ...
windows server 2012 R2里IIS配置.net core2.1遇到的坑
首先刚接触.net core不久,在本地也是简单写点测试程序,没遇到过什么问题,感觉还行,最近朋友搞了个asp.net core2.1的程序,让我给他服务器配置一下,我想这都跨平台了有什么难的吗?拿来 ...
「每日一题」有人上次在dy面试，面试官问我：vue数据绑定的实现原理。你说我该如何回答？
关注「松宝写代码」,精选好文,每日一题时间永远是自己的每分每秒也都是为自己的将来铺垫和增值作者:saucxs | songEagle 来源:原创一.前言文章首发在「松宝写代码」 2020. ...
apply 和 call的用法、区别
1.JavaScript中函数是对象的方法,如果一个函数不是js对象的方法那一定是全局对象的函数,每个函数的对象都有apply和call方法,即每个对象都有call and apply apply:调 ...
经典项目管理 OR 敏捷项目管理，我该怎么选？
CODING 项目协同近期为支持传统项目管理推出了「经典项目管理」.至此,CODING 已全面支持敏捷项目管理以及传统项目管理.那么问题来了,「经典项目管理」和「敏捷项目管理」,我该怎么选呢?本文将从 ...
使用nodejs和express搭建http web服务
目录简介使用nodejs搭建HTTP web服务请求nodejs服务第三方lib请求post 获取http请求的正文 Express和使用express搭建http web服务 express ...
nginx日志按天切割
要求:以天为单位进行日志文件的切割,如host.access_20150915.log, 日志保留最近10天的, 超过10天的日志文件则进行删除. nginxcutlogs.sh脚本内容: #!/bi ...
【EXPDP/IMPDP】ORACLE数据泵导入导出案例(expdp & impdp)
概要: 因项目需要,通常需要将生产库下的部分数据抽取并恢复到测试库上本文主要介绍数据泵导入导出的几种情况以及错误处理案例环境: rhel-server-6.5-x86_64 oracle 11.2 ...
浏览器performance工具介绍及内存问题表现与监控内存的几种方式
一.GC的目的为了实现内存空间的良性循环,performance提供多种监控方式监控内存分析内存相关信息当代码出现问题的时候及时定位到出现问题的代码块, 提高执行效率. preforcemanc ...
19.java设计模式之备忘录模式
基本需求游戏的角色有攻击力和防御力,在大战Boss之前保存自身的状态(攻击力和防御力),当大战Boss之后攻击力和防御力下降,从备忘录对象恢复到大战前的状态传统方案一个对象,就对应一个保存对象状 ...

kafka auto.offset.reset参数解析

kafka auto.offset.reset参数解析

1.latest和earliest区别

2.创建topic

3.生产数据和接收生产数据

4.测试代码

kafka auto.offset.reset参数解析的更多相关文章

随机推荐

热门专题