springboot中实现kafa指定offset消费

kafka消费过程难免会遇到需要重新消费的场景，例如我们消费到kafka数据之后需要进行存库操作，若某一时刻数据库down了，导致kafka消费的数据无法入库，为了弥补数据库down期间的数据损失，有一种做法我们可以指定kafka消费者的offset到之前某一时间的数值，然后重新进行消费。

首先创建kafka消费服务

@Service

@Slf4j

//实现CommandLineRunner接口，在springboot启动时自动运行其run方法。

public class TspLogbookAnalysisService implements CommandLineRunner {

    @Override

    public void run(String... args) {

        //do something

    }

}

kafka消费模型建立

kafka server中每个主题存在多个分区（partition），每个分区自己维护一个偏移量（offset），我们的目标是实现kafka consumer指定offset消费。

在这里使用consumer-->partition一对一的消费模型，每个consumer各自管理自己的partition。

@Service

@Slf4j

public class TspLogbookAnalysisService implements CommandLineRunner {

    //声明kafka分区数相等的消费线程数，一个分区对应一个消费线程

    private  static final int consumeThreadNum = 9;

    //特殊指定每个分区开始消费的offset

    private List<Long> partitionOffsets = Lists.newArrayList(1111,1112,1113,1114,1115,1116,1117,1118,1119);

    private ExecutorService executorService = Executors.newFixedThreadPool(consumeThreadNum);

    @Override

    public void run(String... args) {

        //循环遍历创建消费线程

        IntStream.range(0, consumeThreadNum)

                .forEach(partitionIndex -> executorService.submit(() -> startConsume(partitionIndex)));

    }

}

kafka consumer对offset的处理

声明kafka consumer的配置类

private Properties buildKafkaConfig() {

    Properties kafkaConfiguration = new Properties();

    kafkaConfiguration.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "");

    kafkaConfiguration.put(ConsumerConfig.GROUP_ID_CONFIG, "");

    kafkaConfiguration.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG, "");

    kafkaConfiguration.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, "");

    kafkaConfiguration.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, "");

    kafkaConfiguration.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, "");

    kafkaConfiguration.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG,"");

    kafkaConfiguration.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "");

    ...更多配置项

    return kafkaConfiguration;

}

创建kafka consumer，处理offset，开始消费数据任务

private void startConsume(int partitionIndex) {

    //创建kafka consumer

    KafkaConsumer<String, byte[]> consumer = new KafkaConsumer<>(buildKafkaConfig());

    try {

        //指定该consumer对应的消费分区

        TopicPartition partition = new TopicPartition(kafkaProperties.getKafkaTopic(), partitionIndex);

        consumer.assign(Lists.newArrayList(partition));

        //consumer的offset处理

        if (collectionUtils.isNotEmpty(partitionOffsets)  &&  partitionOffsets.size() == consumeThreadNum) {

            Long seekOffset = partitionOffsets.get(partitionIndex);

            log.info("partition:{} , offset seek from {}", partition, seekOffset);

            consumer.seek(partition, seekOffset);

        }

        //开始消费数据任务

        kafkaRecordConsume(consumer, partition);

    } catch (Exception e) {

        log.error("kafka consume error:{}", ExceptionUtils.getFullStackTrace(e));

    } finally {

        try {

            consumer.commitSync();

        } finally {

            consumer.close();

        }

    }

}

消费数据逻辑，offset操作

private void kafkaRecordConsume(KafkaConsumer<String, byte[]> consumer, TopicPartition partition) {

    while (true) {

        try {

            ConsumerRecords<String, byte[]> records = consumer.poll(TspLogbookConstants.POLL_TIMEOUT);

            //具体的处理流程

            records.forEach((k) -> handleKafkaInput(k.key(), k.value()));

            //												

											springboot中实现kafa指定offset消费的更多相关文章	

								spark streaming从指定offset处消费Kafka数据
		spark streaming从指定offset处消费Kafka数据 -- : 770人阅读 评论() 收藏 举报 分类: spark() 原文地址:http://blog.csdn.net/high ...
		
						springboot中RedisTemplate的使用
		springboot中RedisTemplate的使用 参考 了解 Redis 并在 Spring Boot 项目中使用 Redis--以IBM为学习模板 springboot之使用redistemp ...
		
						javascript中常用坐标属性offset、scroll、client
		原文:javascript中常用坐标属性offset.scroll.client 今天在学习js的时候觉得这个问题比较容易搞混,所以自己画了一个简单的图,并且用js控制台里面输出测试了下,便于理解.  ...
		
						SpringBoot（四）SpringBoot中lombok使用
		lombok概述 lombok简介 Lombok想要解决了的是在我们实体Bean中大量的Getter/Setter方法,以及toString, hashCode等可能不会用到,但是某些时候仍然需要复写 ...
		
						SpringBoot 中常用注解@PathVaribale/@RequestParam/@GetMapping介绍
		SpringBoot 中常用注解@PathVaribale/@RequestParam/@GetMapping介绍 本篇博文将介绍几种如何处理url中的参数的注解@PathVaribale/@Requ ...
		
						SpringBoot中对于异常处理的提供的五种处理方式
		1.自定义错误页面 SpringBoot 默认的处理异常机制:SpringBoot默认的已经提供了一套处理异常的机制.一旦程序中出现了异常,SpringBoot会向/error的url发送请求.在Sp ...
		
						Spring-boot中@ConfigurationProperties，@Value，@PropertySource
		1.利用@ConfigurationProperties获取配置的值,@ConfigurationProperties是springboot提供的基于安全类型的配置放置. application.pr ...
		
						Springboot中使用Xstream进行XML与Bean 相互转换
		在现今的项目开发中,虽然数据的传输大部分都是用json格式来进行传输,但是xml毕竟也会有一些老的项目在进行使用,正常的老式方法是通过获取节点来进行一系列操作,个人感觉太过于复杂.繁琐.推荐一套简单的 ...
		
						springBoot中实现自定义属性配置、实现异步调用、多环境配置
		springBoot中其他相关: 1:springBoot中自定义参数: 1-1.自定义属性配置: 在application.properties中除了可以修改默认配置,我们还可以在这配置自定义的属性 ...
		
		
	

随机推荐	

									树莓派debian配置lamp[解决Apache不显示php网页]
			Apache + MySql + Php． 1.安装Apache Apache可以用下面的命令来安装 sudo apt-get install apache2 Apache默认路径是/var/www/ ...
			
						sparkSQL 简介
			一.Spark SQL的特点 1.支持多种数据源:Hive.RDD.Parquet.JSON.JDBC等.2.多种性能优化技术:in-memory columnar storage.byte-code ...
			
						使用Spring安全表达式控制系统功能访问权限
			一.SPEL表达式权限控制 从spring security 3.0开始已经可以使用spring Expression表达式来控制授权,允许在表达式中使用复杂的布尔逻辑来控制访问的权限.Spring  ...
			
						Leetcode算法【114. 二叉树展开为链表】
			上周通过一位小伙伴,加入了一个氛围很好的小群,人不多,但是大家保持着对知识的渴望,让我很感动. 我自己也有一个群,人数也不多,但是能真正互动起来一起学习,一起进步的,还是太少.所以,现在也在学习如何让 ...
			
						hdu 1285 确定比赛名次 （topsort）
			确定比赛名次Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submi ...
			
						【dp】 AreYouBusy
			题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3535 题意: 多组背包, 0类型为为至少去1样, 1为至多取1样, 2 为随意. 如果将2类型 再添加 ...
			
						破解网站二维码验证，Java实现，不调用任何平台api接口
			package image.images; import java.io.File; import java.io.IOException; import java.io.InputStream; i ...
			
						扛把子组20191017-5 alpha week 2/2 Scrum立会报告+燃尽图 04
			此作业要求参见[https://edu.cnblogs.com/campus/nenu/2019fall/homework/9801] 一.小组情况 队名:扛把子 组长:迟俊文 组员:宋晓丽 梁梦瑶  ...
			
						【Luogu P3834】可持久化线段树（主席树）
			Luogu P3834 可持久化数据结构就是支持在历史版本上进行查询和修改操作的数据结构. 主席树就是对线段树的改进,使之可持久化. 前置知识:动态开点线段树 我们利用权值(值域)线段树统计区间内的数 ...
			
						网页解析--BeautifulSoup练习
			# coding = utf-8 # BeautifulSoup 主要功能是解析提取HTML数据 # re lxml bs4 # pip install Beautifulsoup4 # from b ...