使用Kafka Assistant监控Kafka关键指标
使用Kafka Assistant监控Kafka关键指标
使用Kafka时,我们比较关心下面这些常见指标。
Kafka Assistant下载地址:http://www.redisant.cn/ka
broker度量指标
活跃控制器数量
该指标表示 broker 是否就是当前的集群控制器,其值可以是 0 或 1。如果是 1,表示
broker 就是当前的控制器。任何时候,都应该只有一个 broker 是控制器,而且这个 broker
必须一直是集群控制器。如果出现了两个控制器,说明有一个本该退出的控制器线程被阻
塞了,这会导致管理任务无法正常执行,比如移动分区。为了解决这个问题,需要将这两
个 broker 重启,而且不能通过正常的方式重启,因为此时它们无法被正常关闭。
Kafka Assistant提供了对此指标的监控

请求处理器空闲率
Kafka 使用了两个线程池来处理客户端的请求:网络处理器线程池和请求处理器线程池。
网络处理器线程池负责通过网络读入和写出数据。这里没有太多的工作要做,也就是说,
不用太过担心这些线程会出现问题。请求处理器线程池负责处理来自客户端的请求,包括
从磁盘读取消息和往磁盘写入消息。因此,broker 负载的增长对这个线程池有很大的影响。
Kafka Assistant 通过每隔一段时间对此指标进行采样,绘制了处理器空闲率的走势

主题流入字节
主题流入字节速率使用 b/s 来表示,在对 broker 接收的生产者客户端消息流量进行度量时,
这个度量指标很有用。该指标可以用于确定何时该对集群进行扩展或开展其他与规模增长
相关的工作。它也可以用于评估一个 broker 是否比集群里的其他 broker 接收了更多的流
量,如果出现了这种情况,就需要对分区进行再均衡。
kafka Assistant 可以监控自broker启动以来,流出的字节总数。一分钟的平均速率,五分钟的平均速率,十五分钟平均速率。

主题流出字节
主题流出字节速率与流入字节速率类似,是另一个与规模增长有关的度量指标。流出字节速
率显示的是消费者从 broker 读取消息的速率。流出速率与流入速率的伸缩方式是不一样的,
这要归功于 Kafka 对多消费者客户端的支持。很多 Kafka 的流出速率可以达到流入速率的 6
倍!所以,单独对流出速率进行观察和走势分析是非常重要的。
主题流入的消息
之前介绍的字节速率以字节的方式来表示 broker 的流量,而消息速率则以每秒生成消息个
数的方式来表示流量,而且不考虑消息的大小。这也是一个很有用的生产者流量增长规模
度量指标。它也可以与字节速率一起用于计算消息的平均大小。与字节速率一样,该指标
也能反映集群的不均衡情况。
与主题流入和流出字节一样,Kafka Assistant也对此提供了监控。如下图所示:

分区数量
broker 的分区数量一般不会经常发生改变,它是指分配给 broker 的分区总数。它包括
broker 的每一个分区副本,不管是首领还是跟随者。
首领数量
该度量指标表示 broker 拥有的首领分区数量。与 broker 的其他度量一样,该度量指标也应
该在整个集群的 broker 上保持均等。我们需要对该指标进行周期性地检查,并适时地发出
告警,即使在副本的数量和大小看起来都很完美的时候,它仍然能够显示出集群的不均衡
问题。因为 broker 有可能出于各种原因释放掉一个分区的首领身份,比如 Zookeeper 会话
过期,而在会话恢复之后,这个分区并不会自动拿回首领身份(除非启用了自动首领再均
衡功能)。在这些情况下,该度量指标会显示较少的首领分区数,或者直接显示为零。这
个时候需要运行一个默认的副本选举,重新均衡集群的首领。
离线分区
与非同步分区数量一样,离线分区数量也是一个关键的度量指标(表 10-10)。该度量只能
由集群控制器提供(对于其他 broker 来说,该指标的值为零),它显示了集群里没有首领
的分区数量。
Java虚拟机监控
除了 broker 的度量指标外,还应该对服务器提供的一些标准度量进行监控,包括 Java 虚拟
机(JVM)。如果 JVM 频繁发生垃圾回收,就会影响 broker 的性能,在这种情况下,就应
该得到告警。JVM 的度量指标还能告诉我们为什么 broker 下游的度量指标会发生变化。

使用Kafka Assistant监控Kafka关键指标的更多相关文章
- Kafka 消息监控 - Kafka Eagle
1.概述 在开发工作当中,消费 Kafka 集群中的消息时,数据的变动是我们所关心的,当业务并不复杂的前提下,我们可以使用 Kafka 提供的命令工具,配合 Zookeeper 客户端工具,可以很方便 ...
- Oracle监控的关键指标
1.监控事例的等待 select event, , , )) "Prev", , , )) "Curr", count(*) "Tot" f ...
- Prometheus+Grafana通过kafka_exporter监控kafka
Prometheus+Grafana通过kafka_exporter监控kafka 一.暴露 kafka-metric 方式 二.jmx_exporter方式 2.1 下载jmx_prometheus ...
- Prometheus监控Kafka
Prometheus监控Kafka 1.Prometheus监控Kafka,Docker方式 Kafka监控优秀博文: 简书:whaike:[监控]Kafka - 详细指标 CSDN:GeekXuSh ...
- kafka消息监控-KafkaOffsetMonitor
参照site:https://github.com/quantifind/KafkaOffsetMonitor 一.简述 这个应用程序用来实时监控Kafka服务的Consumer以及它们所在的Part ...
- KafkaOffsetMonitor监控kafka
KafkaOffsetMonitor监控kafka 1. KafkaOffsetMonitor是一个可以用于监控Kafka的Topic及Consumer消费状况的工具,其配置和使用特别的方便.源项目G ...
- 如何使用JMX监控Kafka
使用kafka做消息队列中间件时,为了实时监控其性能时,免不了要使用jmx调取kafka broker的内部数据,不管是自己重新做一个kafka集群的监控系统,还是使用一些开源的产品,比如yahoo的 ...
- 使用JMX监控Kafka
监控数据源 JMX RMI方式启动Broker,Consumer,Producer -ea -Dcom.sun.management.jmxremote.authenticate=false -Dco ...
- Kafka monitoring监控
一.Metrics kafka有两个metrics包,在看源码的时候很容易混淆 package kafka.metrics package org.apache.kafka.common.metric ...
- 使用kafka-eagle监控Kafka
# 监控kafka集群,开启监控趋势图使用 # 有一个问题,需要在kafka-server-start.sh文件中配置端口,有如下三种办法 # 第一种:复制并修改kafka目录,比如kafka-1,k ...
随机推荐
- 记录--浏览器渲染15M文本导致崩溃怎么办
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 最近,我刚刚完成了一个阅读器的txt文件阅读功能,但在处理大文件时,遇到了文本内容过多导致浏览器崩溃的问题. 一般情况下,没有任何样式渲染 ...
- 记录-记一次不规范使用key引发的惨案
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前言 平时在使用v-for的时候,一般会要求传入key,有没有像我一样的小伙伴,为了省心,直接传索引index,貌似也没有遇到过什么问题, ...
- Clang Preprocessor 类的创建
参考: Create a working compiler with the LLVM framework, Part 2 How to parse C programs with Clang: A ...
- KingbaseES数据库-生产环境慢查询性能优化案例
一.背景 在生产环境中,慢查询不仅影响系统.业务的正常处理.同时严重影响用户的使用感受. 二.表相关信息 2.1 表结构及索引: Table "yktcore.t_dtl_ymt" ...
- 第十三届蓝桥杯大赛软件赛省赛【Java 大学B 组】试题A: 星期计算
1 public class Test { 2 public static void main(String args[]) { 3 double res=20.0; 4 for(int i=0 ;i ...
- Scala 函数闭包和柯里化
1 package com.atguigu.function 2 3 object HighFunction { 4 def main(args: Array[String]): Unit = { 5 ...
- #dp#CodeChef Little Elephant and Mouses
LEMOUSE 分析 由于被单只老鼠吓到只能算一次,所以前两次走的位置也可能会被老鼠吓到. 设 \(dp[n][m][o][p]\) 表示走到 \((n,m)\) 上一步走的是 \(o\) 这种方式, ...
- 《深入理解Java虚拟机》读书笔记: 虚拟机类加载的时机和过程
虚拟机类加载的时机和过程 一.类加载的时机 类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载(Loading).验证(Verification).准备(Preparation ...
- 【VMware vCenter】使用Reduced Downtime Update (RDU)升级更新vCenter Server。
Reduced Downtime Upgrade (RDU) 减少停机时间更新是用于vCenter Server更新升级的一种新的方式,顾名思义,主要目的就是为了减少在vCenter Server更新 ...
- 在 Visual Studio 2022 中创建一个类似于旧版本 Visual Studio 中的 Win32 Console Application 项目
在 Visual Studio 2022 中创建一个项目,其自动生成的源文件内容包含 #include "stdafx.h" 和使用_tmain 作为入口点,意味着你需要创建一个基 ...