kafka Auto offset commit faild reblance

今天在使用python消费kafka时遇到了一些问题，特记录一下。

场景一、

特殊情况：单独写程序只用来生产消费数据

开始时间： 10：42

Topic: t_facedec

Partition: 1

程序启动： 168 启动consumer, 158启动consumer, windows机器producer推数据

运行时长： 15分钟

结果：

1、168的consume暂停，158的consumer一直消费

2、10：46分producer停止后重启推数， 158停止消费又开始消费

3、10：49分停止168、158的consumer并按顺序重启， 168消费一些数据之后158开始一直消费

4、后启动的consumer在消费数据

场景二、

特殊场景：上线程序，包含人脸识别处理

开始时间： 11：00

Topic: t_facedec

Partition: 1

1、11:46 启动168的conumer消费， 6分钟后日志如下，未见异常信息

场景二、

特殊场景：上线程序，包含人脸识别处理

开始时间： 11：00

Topic: t_facedec

Partition: 1

1、11:46 启动168的conumer消费， 6分钟后日志如下，未见异常信息

2、 11:53启动158的consumer，日志如下，未见异常， 158的consumer加入了组kongzhagen

3、168的consumer发出警告，心跳失败，因组正在重新平衡

4、windows端启动producer， 168的consumer开始消费数据， 158的consumer没有消费数据

结论：先启动的consumer会消费数据， 168的consumer关闭后， 158的consumer开始消费

5、半小时后

分解错误图：

9分钟后空连接时间到'connections_max_idle_ms': 540000,

'max_poll_records': 500, 'heartbeat_interval_ms': 3000, 'session_timeout_ms': 30000,

后续：

14：32开始继续生产数据，数据开始被消费

14：48分再次出现平衡超时

15：02分再次出现平衡超时

原因分析：

1、引起timeout的原因是consumer每3秒触发一次心跳，由于某种原因在30秒内协调者没有收到此consumer的心跳信息，认为此consumer已经死掉，topic内的分区在group的成员间重新分配(reblance)

2、默认consumer的每次最大poll数据量为500，如果处理这500条记录的时候超过了最大时间间隔max_poll_interval_ms， consumer也会退出group，导致reblance的产生

3、如果consumer没有产生消费行为的时间超过最大值connections_max_idle_ms：540000 (9 min)时，也会导致consumer退出该组。

解决方法：

1、增加心跳会话超时间隔

session_timeout_ms = 300000（从30改为300秒）

2、减少每次获取任务的数量

max_poll_records = 5（从500改为5）

3、增加空闲连接时间

connections_max_idle_ms=5400000（从9min改为90min）

kafka Auto offset commit faild reblance的更多相关文章

kafka auto.offset.reset参数解析
kafka auto.offset.reset参数解析 1.latest和earliest区别 2.创建topic 3.生产数据和接收生产数据 4.测试代码 auto.offset.reset关乎ka ...
Kafka auto.offset.reset
要从头消费kafka的数据,可以通过以下参数: Kafka auto.offset.reset = earliest
kafka之consumer参数auto.offset.reset 0.10+
https://blog.csdn.net/dingding_ting/article/details/84862776 https://blog.csdn.net/xianpanjia4616/ar ...
kafka的auto.offset.reset详解与测试
1. 取值及定义 auto.offset.reset有以下三个可选值: latest (默认) earliest none 三者均有共同定义: 对于同一个消费者组,若已有提交的offset,则从提交的 ...
kafka的offset相关知识
Offset存储模型由于一个partition只能固定的交给一个消费者组中的一个消费者消费,因此Kafka保存offset时并不直接为每个消费者保存,而是以 groupid-topic-partit ...
「Kafka」Kafka中offset偏移量提交
在消费Kafka中分区的数据时,我们需要跟踪哪些消息是读取过的.哪些是没有读取过的.这是读取消息不丢失的关键所在. Kafka是通过offset顺序读取事件的.如果一个消费者退出,再重启的时候,它知道 ...
kafka主题offset各种需求修改方法
简要:开发中,常常因为需要我们要认为修改消费者实例对kafka某个主题消费的偏移量.具体如何修改?为什么可行?其实很容易,有时候只要我们换一种方式思考,如果我自己实现kafka消费者,我该如何让我们的 ...
Kafka提交offset机制
在kafka的消费者中,有一个非常关键的机制,那就是offset机制.它使得Kafka在消费的过程中即使挂了或者引发再均衡问题重新分配Partation,当下次重新恢复消费时仍然可以知道从哪里开始消费 ...
kafka_2.11-0.10.2.1中的auto.offset.reset
在使用spark连接kafka消费topic时,发现无论怎么设置,也无法从头开始消费. 查看配置得出auto.offset.reset的以下3种设置及含义: earliest 当各分区下有已提交的of ...

随机推荐

Testbench编写技巧
一.基本架构(常用模板) `timescale 1ns/1ps //时间精度 `define Clock //时钟周期 module my_design_tb; //================= ...
quartz2.3.0（十四）trigger触发器优先级排序
job任务类: package org.quartz.examples.example14; import org.slf4j.Logger; import org.slf4j.LoggerFacto ...
广度优先搜索（BFS）思路及算法分析
1.算法用途: 是一种图像搜索演算法.用于遍历图中的节点,有些类似于树的深度优先遍历.这里唯一的问题是,与树不同,图形可能包含循环,因此我们可能会再次来到同一节点. 2.主要思想: 主要借助一个队列. ...
HDFS-HA高可用集群搭建
HA高可用集群搭建 1.总体集群规划在hadoop102.hadoop103和hadoop104三个节点上部署Zookeeper. hadoop102 hadoop103 hadoop104 Nam ...
java 正则和连接json
前面已经写了不少关于C# 怎么使用正则,有兴趣,可以翻译成java代码. 以图片为例子: import java.util.regex.Matcher; import java.util.regex. ...
C# HtmlAgilityPack爬取静态页面
最近对爬虫很感兴趣,稍微研究了一下,利用HtmlAgilityPack制作了一个十分简单的爬虫,这个简易爬虫只能获取静态页面的Html HtmlAgilityPack简介 HtmlAgilityPac ...
python-django框架中使用docker和elasticsearch配合实现搜索功能
注意:系统环境为Ubuntu18 一.docker安装 0:如果之前有安装过docker使用以下命令卸载: sudo apt-get remove docker docker-engine docke ...
【洛谷 P2597】 [ZJOI2012]灾难（LCA）
题目链接考虑建一棵树,使一个生物灭绝时他的子树都会灭绝,显然这样答案就是以每个点为根的子树大小-1. 为什么原图不是一棵树,因为一个生物可能会以多个生物为食,所以按拓扑序来建树,把每个遍历到的点的父 ...
GIt三剑客
一. Github 什么是Github? github是一个基于git的代码托管平台,付费用户可以建私人仓库,我们一般的免费用户只能使用公共仓库,也就是代码要公开. Github 由Chris Wan ...
js合并多个array
Array.prototype.concat.call(array1, array2, array3, ...)

kafka Auto offset commit faild reblance

kafka Auto offset commit faild reblance的更多相关文章

随机推荐

热门专题