kafka笔记9（监控）

Kafka提供的所有度量指标都是通过JMX（Java Management Extensions）接口访问

JMX端口查询： zookeeper上获取端口信息 /brokers/ids/<ID>节点包含json格式的broker信息，里面含有JMX对应的主机名和端口

JMX接口提供的是内部度量指标，第三方程序提供的则是外部度量指标

应用程序健康检测:

　　使用外部进程来报告broker的运行状态(健康检测)

　　在broker停止发送度量指标时发出告警(stale度量指标)

broker度量指标

　　非同步分区数量: 作为首领的broker有多少个分区处于非同步状态

　　该值大于0就要采取措施,首先建议重新选举首领,看看能否解决问题

　　问题排查步骤:

　　集群级别的问题:

　　　　不均衡的负载资源过度消耗

　　　　问题定位: 用到以下度量指标

　　　　　　　　分区数量首领分区数量主题流入字节速率主题流入消息速率

　　　　　　　　在一个均衡集群里,度量指标的数值在整个集群范围内均等的

　　　　　　　　以下资源出现过度消耗会导致分区不同步

　主机级别问题:

　　　　硬件问题

　　　　　　磁盘问题是常见的故障,导致分区不同步,拖慢整个集群broker请求

　　　　进程冲突

　　　　本地配置的不一致　　　　　

　　活跃控制器数量:

　　　　表示broker是否就是当前的集群控制器,1代表是,任何时候集群应该只有一个集群控制器

　　请求处理器空闲率

　　　　　　空闲率低于20%说明存在潜在问题,低于10%说明存在性能问题

　　主题流入字节

　　主题流出字节

　　主题流入消息

　　分区数量:

　　首领数量:

　　　　该度量指标表示broker拥有的首领分区数量,与其他度量一样,该度量指标也应该在整个集群的broker上保持均等

　　　　一个均衡集群如果复制系数是N,则该百分比应该为1/N

　　离线分区: 显示集群里没有首领的分区数量

　　　　分区离线的主要原因: 包含分区副本的broker都关闭了; 消息不匹配,没有同步副本可以拿到首领身份(并且禁用了不完全的首领选举)

　　请求度量指标:

主题和分区的度量指标:(指定某个主题)

　　　　主题实例的度量指标: 取决于集群主题数量

　　　　分区实例的度量指标

JAVA虚拟机监控

　　　　垃圾回收:

　　　　Java操作系统监控

日志:

　　Kafka.controller 记录集群控制器的消息

　　kafka.server.ClientQuotaManager 记录与生产和消费配额活动相关的信息　　　　

　　启用kafka.log.LogCleaner kafka.log.Cleaner kafka.log.LogCleanerManager这些日志,并设置为DEBUG级别,就可以输出日志压缩线程的运行状态

客户端监控

　　生产者度量指标

　　　　record-error-rate 是一个完全有必要对其设置告警的属性,一般情况下是0,大于0,说明生产者正在丢弃无法发送的消息

　　　　record-retry-rate 重试次数

　　　　request-latency-avg 设置告警,表示发送一个生产者请求到broker所需的平均时间

　　3种不同视图: outgoing-byte-rate 每秒钟消息的字节数 record-send-rate 每秒消息的数量 request-rate 每秒钟生产者发送给broker的请求数

　　Per-broker和Per-topic 度量指标

　　消费者度量指标:

　　　　　Fetchmanager度量指标

　　　　　　 fetch-latency-avg 表示消费者向Broker发送请求所需要的时间

　　　　　　Coordinator度量指标

　　　　　　配额

延迟监控

端到端监控

kafka笔记9（监控）的更多相关文章

Kafka 集群消息监控系统：Kafka Eagle
Kafka Eagle 1.概述在开发工作当中,消费 Kafka 集群中的消息时,数据的变动是我们所关心的,当业务并不复杂的前提下,我们可以使用 Kafka 提供的命令工具,配合 Zookeeper ...
kafka集群监控之kafka-manager部署(kafka-manager的进程为：ProdServerStart)
kafka集群监控之kafka-manager部署(ProdServerStart) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 雅虎官网GitHub项目:https://git ...
Kafka笔记整理（三）：消费形式验证与性能测试
Kafka消费形式验证前面的<Kafka笔记整理(一)>中有提到消费者的消费形式,说明如下: .每个consumer属于一个consumer group,可以指定组id.group.id ...
kafka笔记博客
大数据数据流组件选择: https://www.cnblogs.com/yinzhengjie/articles/11155051.html 初识Apache Kafka 核心概念: https:// ...
完整的ELK+filebeat+kafka笔记
之前有写过elasticsearch集群和elk集群的博客, 都是基于docker的,使用docker-compose进行编排(K8S暂未掌握) 三台服务器搭建es集群:https://www.cnb ...
Kafka笔记--监控系统KafkaOffsetMonitor
KafkaOffsetMonitor下载链接: http://download.csdn.net/detail/changong28/7930337github官方:https://github.co ...
【转载】apache kafka系列之-监控指标
原文地址:http://blog.csdn.net/lizhitao/article/details/24581907 1.监控目标 1.当系统可能或处于亚健康状态时及时提醒,预防故障发生 2.报警提 ...
apache kafka系列之-监控指标
apache kafka中国社区QQ群:162272557 1.监控目标 1.当系统可能或处于亚健康状态时及时提醒,预防故障发生 2.报警提示 a.短信方式 b.邮件 2.监控内容 2.1 机器监控 ...
Kafka OffsetMonitor：监控消费者和延迟的队列
一个小应用程序来监视kafka消费者的进度和它们的延迟的队列. KafkaOffsetMonitor是用来实时监控Kafka集群中的consumer以及在队列中的位置(偏移量). 你可以查看当前的消费 ...

随机推荐

Beta冲刺4/7
目录摘要团队部分个人部分摘要队名:小白吃组长博客:hjj 作业博客:beta冲刺(4/7) 团队部分后敬甲(组长) 过去两天完成了哪些任务整理博客 ppt模板接下来的计划做好机动. ...
scrapy_redis 相关: 将 jobdir 保存的爬虫进度转移到 Redis
0.参考 Scrapy 隐含 bug: 强制关闭爬虫后从 requests.queue 读取的已保存 request 数量可能有误 1.说明 Scrapy 设置 jobdir,停止爬虫后,保存文件目录 ...
pandas处理丢失数据-【老鱼学pandas】
假设我们的数据集中有缺失值,该如何进行处理呢? 丢弃缺失值的行或列首先我们定义了数据集的缺失值: import pandas as pd import numpy as np dates = pd. ...
Tornado之异步authenticated
authenticated是tornado自带的登录验证装饰器,它的实现比较简单,验证比较简易,无法做到真正意义的前后端分离并且是同步的方式,所以这里我对它进行了重写,以适应异步JWT方式的登录验证. ...
数据挖掘算法——Apriori算法
Apriori算法首先,Apriori算法是关联规则挖掘中很基础也很经典的一个算法. 转载来自:链接:https://www.jianshu.com/p/26d61b83492e 所以做如下补充: ...
SpringCloud使用Nacos服务发现实现远程调用
本文使用SpringCloud结合Nacos服务发现,Feign远程调用做一个简单的Demo. 1 Nacos 关于Nacos之前写了两篇文章关于SpringBoot对它的使用,感兴趣可以查看一下. ...
fflush()函数：更新缓冲区
fflush()的作用是用来刷新缓冲区: fflush(stdin)刷新标准输入缓冲区,把输入缓冲区里的东西丢弃:stdin是standard input的缩写,即标准输入,一般是指键盘:标准输入缓冲 ...
Android SQL数据库应用实践 “问题点”“疑难点”“解析”
应用 Android SQL 数据库时,遇到的问题: 场景1:Android SQL查询后,获取到Cursor并查询数据:遇到以下问题:"android.database.CursorInd ...
bzoj2982: combination(lucas定理板子)
2982: combination Time Limit: 1 Sec Memory Limit: 128 MBSubmit: 664 Solved: 397[Submit][Status][Di ...
JavaScript Dom级别

kafka笔记9（监控）

kafka笔记9（监控）的更多相关文章

随机推荐

热门专题