背景现象

1.20晚上8点业务线开始切换LBS相关流量，在之后的1个小时时间内，积压量呈上升趋势，一路到达50W左右，第二天的图没贴出具体是50W数字，以下是第一天晚上的贴图部分。

现象一：

现象二：

当时现场图后来就找不回来了，凭印象说明了一下数字。

简要说明一下上述两个图

图一：其实很明显，明显看出，消费者消费速度明显跟不上生产者的发送速度，导致出现积压情况。

图二：图二就有点意思了，因为上游通过Kafka消息队列发送消息给我，分区数是20个。由于消费组内消费者实例是17个，所以从宏观上分析，势必会有3个消费者会承担多消费一个分区的情况。这个倒也容易理解。但为什么会积压这么多。个人分析了一下，主要还是跟消费者本身消费的消费业务逻辑有关。因为我的消费业务逻辑是要调用下游一个LBS地图服务的，通过设备上报的WIFE内容经过公司LBS平台接口换取设备当前地理位置坐标信息，但这个地理位置服务，R通过命令：thread-n3-i 500 : 列出500毫秒内最忙的3个线程栈，其中就有两个属于调用地理位置服务的线程。

通过命令：thread-n3-i 500(阿里开源诊断工具Arthas：thread命令) : 列出500毫秒内最忙的3个线程栈，其中就有两个属于调用地理位置服务的线程。

原因分析

分析了具体原因具体是两个层面

HMS-Client(公司自己封装的调用消息队列的SDK)层面

根据图一，其实想说明一点的是，在本应用调用下游服务延迟高的场景下，从图一的现象看出，消费者的利用率其实不高，topic有20个分片，消费组17个容器实例，14个实例基本对应一个分区，有三个实例对应2个分区，导致资源利用率其实很低，而我们其实是希望在下游服务相应慢的情况下,最好有更多线程参与去消费任务，增加吞吐率，提高处理效率（IO密集型应用，尽量提高处理线程数）。而我们的处理线程数是5个，即最高5个线程会去处理任务，其他都会等待进入

这两个参数，当下应用设置了5个，但我的机器配置是8核16G，参数设置是不合理的。这个参数主要是从其他项目中拷贝过来，没过多关注他，在高并发应用场景下，想不多却成为瓶颈，特别是消费线程内如果涉及到RT很高，QPS上不去的下游服务，就有讲究了。

调用下游服务响应延迟高

这个我上述图二已经有详细描述了

解决方案

调整Client 消费线程数，从原来的5调整到20个线程
增加KAFKA的分片数，临时方案，目前已经让中间件从原来的分片数20调整到60，积压下降的明显。因为消费组内的消费者实例一个承担了基本3-4个分区消息数。

公司内部一次关于kafka消息队列消费积压故障复盘分享的更多相关文章

kafka消息队列的简单理解
kafka在大数据.分布式架构中都很流行.kafka可以进行流式计算,也可以做为日志系统,还可以用于消息队列. 本篇主要是消息队列相关的知识. 零.kafka作为消息队列的优点: 分布式的系统高吞吐 ...
初试kafka消息队列中间件一（只适合初学者哈）
初试kafka消息队列中间件一今天闲来有点无聊,然后就看了一下关于消息中间件的资料, 简单一点的理解哈,网上都说的太高大上档次了,字面意思都想半天: 也就是用作消息通知,比如你想告诉某某你喜欢他,或 ...
初试kafka消息队列中间件二（采用java代码收发消息）
初试kafka消息队列中间件二(采用java代码收发消息) 上一篇初试kafka消息队列中间件一今天的案例主要是将采用命令行收发信息改成使用java代码实现,根据上一篇的接着写: 先启动Zooke ...
使用Cloudera Manager部署Kafka消息队列
使用Cloudera Manager部署Kafka消息队列作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.下载需要安装的Kafka版本 1>.查看Cloudera Dis ...
Kafka：docker安装Kafka消息队列
安装之前先看下图 Kafka基础架构及术语 Kafka基本组成 Kafka cluster: Kafka消息队列(存储消息的队列组件) Zookeeper: 注册中心(kafka集群依赖zookee ...
Canal Server发送binlog消息到Kafka消息队列中
Canal Server发送binlog消息到Kafka消息队列中一.背景二.需要修改的地方 1.canal.properties 配置文件修改 1.修改canal.serverMode的值 2. ...
Kafka基础教程（四）：.net core集成使用Kafka消息队列
.net core使用Kafka可以像上一篇介绍的封装那样使用(Kafka基础教程(三):C#使用Kafka消息队列),但是我还是觉得再做一层封装比较好,同时还能使用它做一个日志收集的功能. 因为代码 ...
Kafka消息队列初识
一.Kafka简介 1.1 什么是kafka kafka是一个分布式.高吞吐量.高扩展性的消息队列系统.kafka最初是由Linkedin公司开发的,后来在2010年贡献给了Apache基金会,成为了 ...
MQ选型对比ActiveMQ,RabbitMQ,RocketMQ,Kafka 消息队列框架选哪个？
最近研究消息队列,发现好几个框架,搜罗一下进行对比,说一下选型说明: 1)中小型软件公司,建议选RabbitMQ.一方面,erlang语言天生具备高并发的特性,而且他的管理界面用起来十分方便.不考虑r ...

随机推荐

windows下php安装redis扩展
查看当前PHP版本代码中添加 phpinfo(); 下载对应的redis扩展下载链接:https://pecl.php.net/package/redis 因为我的PHP版本是5.6的,所以red ...
c++设计模式概述之命令
代码写的不够规范,目的是为了缩短文章篇幅,实际中请不要这样做. 1.概述命令模式是一种数据驱动的模式.将请求封装到命令的对象中,再传给调用对象,调用对象再处理该命令. [将一个请求封装为一个对象] ...
【LeetCode】873. Length of Longest Fibonacci Subsequence 解题报告（Python）
[LeetCode]873. Length of Longest Fibonacci Subsequence 解题报告(Python) 标签(空格分隔): LeetCode 作者: 负雪明烛 id: ...
【LeetCode】814. Binary Tree Pruning 解题报告（Python & C++）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法后序遍历日期题目地址:https://leetc ...
【LeetCode】300. Longest Increasing Subsequence 解题报告（Python & C++）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法日期题目地址:https://leetcode.c ...
[opencv]白平衡算法中的灰度世界法,改善图像发红发蓝发绿的现象
#include<iostream> #include <opencv2/opencv.hpp> #include <math.h> using namespace ...
Java Web程序设计笔记 • 【目录】
章节内容实践练习 Java Web程序设计作业目录(作业笔记) 第1章 Java Web程序设计笔记 • [第1章 Web应用程序] 第2章 Java Web程序设计笔记 • [第2章 JSP基础 ...
MySQL基础操作指南
启动停止MySQL服务 1.Windows服务窗口启动:开始 → 运行 → services.msc → 找到MySQL 56服务 2.MySQL命令启动:开始 → 运行 → 管理员权限运行cmd → ...
编写Java程序，通过接口摸拟麦当劳食物生产过程，接口设计
返回本章节返回作业目录需求说明: 通过接口摸拟麦当劳食物生产过程实现思路: 通过接口摸拟麦当劳食物生产过程的实现思路: 创建接口食物(Food),该接口需要被所有的食物类所实现.在该接口中定义g ...
Android开发案例设置背景图片轮播
点击按钮实现图片轮播效果实践案例: xml <?xml version="1.0" encoding="utf-8"?> <LinearLa ...

公司内部一次关于kafka消息队列消费积压故障复盘分享