使用Grafana + jmx 监控 kafka3.5 的过程

摘要

周五一边进行数据库监控, 同时想着部署一套监控系统.

能够监控一下kafka等中间件

结果不想自己遇到了很多坑.

下午有同事语音告诉自己一些排查问题的方式与方法.

自己又多花了半个小时才将数据捞出来.

感觉自己对很多工具的使用还是不够体系, 需要加强学习.

但是还是需要多学习和多记录的

StudyFrom

https://blog.csdn.net/LCBUSHIHAHA/article/details/132216491

https://grafana.com/grafana/dashboards/18276-kafka-dashboard/

需要注意的是 两者其实是一套机制.

问题的原因其实在于 3.5的kafka可能是与这个文档存在兼容性问题的.

部署方式

注意 我这边kafka的安装目录是 /usr/kafka 所以后面脚本比较简洁

下载jmx的文件到 /usr/kafka的目录下面

jmx_prometheus_javaagent-0.19.0.jar

然后创建一个配置文件 /usr/kafka/config.yaml 

还需要修改一下启动文件

我这边的就是 /usr/kafka/bin/kafka-server-start.sh

可以在文件的最前面增加上:

export KAFKA_OPTS=-javaagent:/usr/kafka/jmx_prometheus_javaagent-0.19.0.jar=19092:/usr/kafka/config.yaml

注意端口需要是不被占用的端口.

配置文件内容

lowercaseOutputName: true

rules:

# Special cases and very specific rules

- pattern : kafka.server<type=(.+), name=(.+), clientId=(.+), topic=(.+), partition=(.*)><>Value

  name: kafka_server_$1_$2

  type: GAUGE

  labels:

    clientId: "$3"

    topic: "$4"

    partition: "$5"

- pattern : kafka.server<type=(.+), name=(.+), clientId=(.+), brokerHost=(.+), brokerPort=(.+)><>Value

  name: kafka_server_$1_$2

  type: GAUGE

  labels:

    clientId: "$3"

    broker: "$4:$5"

- pattern : kafka.coordinator.(\w+)<type=(.+), name=(.+)><>Value

  name: kafka_coordinator_$1_$2_$3

  type: GAUGE

# Generic per-second counters with 0-2 key/value pairs

- pattern: kafka.(\w+)<type=(.+), name=(.+)PerSec\w*, (.+)=(.+), (.+)=(.+)><>Count

  name: kafka_$1_$2_$3_total

  type: COUNTER

  labels:

    "$4": "$5"

    "$6": "$7"

- pattern: kafka.(\w+)<type=(.+), name=(.+)PerSec\w*, (.+)=(.+)><>Count

  name: kafka_$1_$2_$3_total

  type: COUNTER

  labels:

    "$4": "$5"

- pattern: kafka.(\w+)<type=(.+), name=(.+)PerSec\w*><>Count

  name: kafka_$1_$2_$3_total

  type: COUNTER

- pattern: kafka.server<type=(.+), client-id=(.+)><>([a-z-]+)

  name: kafka_server_quota_$3

  type: GAUGE

  labels:

    resource: "$1"

    clientId: "$2"

- pattern: kafka.server<type=(.+), user=(.+), client-id=(.+)><>([a-z-]+)

  name: kafka_server_quota_$4

  type: GAUGE

  labels:

    resource: "$1"

    user: "$2"

    clientId: "$3"

# Generic gauges with 0-2 key/value pairs

- pattern: kafka.(\w+)<type=(.+), name=(.+), (.+)=(.+), (.+)=(.+)><>Value

  name: kafka_$1_$2_$3

  type: GAUGE

  labels:

    "$4": "$5"

    "$6": "$7"

- pattern: kafka.(\w+)<type=(.+), name=(.+), (.+)=(.+)><>Value

  name: kafka_$1_$2_$3

  type: GAUGE

  labels:

    "$4": "$5"

- pattern: kafka.(\w+)<type=(.+), name=(.+)><>Value

  name: kafka_$1_$2_$3

  type: GAUGE

# Emulate Prometheus 'Summary' metrics for the exported 'Histogram's.

#

# Note that these are missing the '_sum' metric!

- pattern: kafka.(\w+)<type=(.+), name=(.+), (.+)=(.+), (.+)=(.+)><>Count

  name: kafka_$1_$2_$3_count

  type: COUNTER

  labels:

    "$4": "$5"

    "$6": "$7"

- pattern: kafka.(\w+)<type=(.+), name=(.+), (.+)=(.*), (.+)=(.+)><>(\d+)thPercentile

  name: kafka_$1_$2_$3

  type: GAUGE

  labels:

    "$4": "$5"

    "$6": "$7"

    quantile: "0.$8"

- pattern: kafka.(\w+)<type=(.+), name=(.+), (.+)=(.+)><>Count

  name: kafka_$1_$2_$3_count

  type: COUNTER

  labels:

    "$4": "$5"

- pattern: kafka.(\w+)<type=(.+), name=(.+), (.+)=(.*)><>(\d+)thPercentile

  name: kafka_$1_$2_$3

  type: GAUGE

  labels:

    "$4": "$5"

    quantile: "0.$6"

- pattern: kafka.(\w+)<type=(.+), name=(.+)><>Count

  name: kafka_$1_$2_$3_count

  type: COUNTER

- pattern: kafka.(\w+)<type=(.+), name=(.+)><>(\d+)thPercentile

  name: kafka_$1_$2_$3

  type: GAUGE

  labels:

    quantile: "0.$4"

重启添加相关prometheus

修改好配置文件和config.yaml 后需要重启kafka

然后修改prometheus 的配置文件

增加对应的job 

需要注意, 这里面一个job 对应一套kafka, 我这边是single的节点, 所以比较简单一些.

  - job_name: 'kafka203'

    metrics_path: /metrics

    static_configs:

    - targets: ["192.168.254.203:19092"]

      labels:

        instance: kafka203

注意ip地址和端口的对应关系, 重启或者是刷新prometheus

就可以进行验证了 可以通过

prometheus的界面进行验证

http://192.168.255.xx:port/targets?search=

可以通过show more 的方式进行查看

打开链接 验证可以监控到jmx的相关信息.

导入grafana的面板

ID为: 18276

需要注意, 因为缺少一个必备的 变量, 直接引入时无法使用的.

而且貌似 3.5和jmx0.19 的版本缺少了一个必备的变量参数, 建议可以修改grafana 的这个 18276 的配置, 修改变量进行 修改为 

settings -> Variables -> 点击kafka_job_name -> 选择 select variable type 修改为custom

->在 custom options  输入自己在prometheus 里面定义的job_name

-> 比如我这边是kafka203,kafka204 通过 逗号进行分割.

总结

再次进入grafana 查看kafka相关的信息

能够展示出一些基本的kafka信息.

本次处理过程中, 没注意到这里面的问题.

其实prometheus 里面是可以 进行查询和验证的. 

代码能力是必须得有的, 而且必须有细心和慢慢查询的能力.

使用Grafana + jmx 监控 kafka3.5 的过程的更多相关文章

使用Collectd + InfluxDB + Grafana进行JMX监控
我们已经看到使用Collectd监控CPU /内存利用率(本文).但它没有提供所有信息来确定性能问题的瓶颈.在本文中,我们将使用Collectd Java插件来使用其JMX技术来监视和管理Java虚拟 ...
基于Centos7.4搭建prometheus+grafana+altertManger监控Spring Boot微服务（docker版）
目的:给我们项目的微服务应用都加上监控告警.在这之前你需要将 Spring Boot Actuator引入本章主要介绍如何集成监控告警系统Prometheus 和图形化界面Grafana 如何自定 ...
Tomcat调优及JMX监控
Tomcat调优及JMX监控实验背景 ====================================================== 系统版本:CentOS release 6.5 ( ...
基于Grafana的监控数据钻取功能应用实践
互联网企业中,随着机器规模以及业务量的爆发式增长,监控数据逐渐成为一种大数据,对监控大数据的分析,包括数据采集.数据缓存.数据聚合分析.数据存储.数据展现等几个阶段.不同阶段有不同的解决方案及支撑工具 ...
Zabbix 通过 JMX 监控 java 进程
参考: [ JMX monitoring ] [ Zabbix Java gateway ] [ JMX Monitoring (Java Gateway) not Working ] [ Monit ...
监控应用服务器使用JMX监控Tomcat (推荐)
前言:做了一个监控应用服务器的项目(支持Tocmat.WebSphere.WebLogic各版本), 过程也算是磕磕绊绊,由于网上缺少相关资料,或者深陷于知识的海洋难以寻觅到有效的资料,因而走过不少弯 ...
Zabbix-(六) JMX监控
Zabbix-(六) JMX监控一.前言 Zabbix提供了JMX监控,它通过JMX API获取JVM信息,从而提供监控数据.本文讲述使用JMX监控Tomcat的JVM信息. 准备 Zabbix S ...
Prometheus+Grafana企业监控系统
Prometheus+Grafana企业监控系统作者刘畅实验配置: 主机名称 Ip地址 controlnode 172.16.1.70/24 slavenode1 172.16.1.71/24 ...
ActiveMQ笔记(5)：JMX监控
系统上线运行后,及时监控报警是很必要的手段,对于ActiveMQ而言,主要监控的指标有:MQ本身的健康状况.每个队列的生产者数量.消费者数量.队列的当前消息数等. ActiveMQ支持JMX监控,使用 ...
Jetty服务器jmx监控
Jetty服务器jmx监控 Jetty 服务器增加jmx,jmx-remote模块 1.修改对应jetty服务器的配置文件start.ini追加如下两行–module=jmx–module=jmx-r ...

随机推荐

MySQL|MySQL事物以及隔离级别
MySQL 事务主要用于处理操作量大,复杂度高的数据.比如开单,需要添加给订单表增加记录,还需要增加订单的各种相关明细,操作复杂度高,这些操作语句需要构成一个事务.在 MySQL 命令行的默认设置下, ...
文心一言 VS 讯飞星火 VS chatgpt （25）-- 算法导论4.2 7题
七.设计算法,仅使用三次实数乘法即可完成复数 a+bi和c+di 相乘.算法需接收a.b.c和d 为输入,分别生成实部 ac-bd 和虚部ad+bc. 文心一言: 可以使用如下算法来计算复数 a+bi ...
18、Scaffold 布局组件
Scaffold 是一个非常重要的布局组件,它提供了一个常见的应用程序结构布局,包含了许多基础的 UI 元素和交互方式. Scaffold 组件主要由以下几个部分组成: AppBar:用于显示在页面顶 ...
maven系列：属性管理和版本管理
目录一. 属性配置与使用 ①:定义属性 ②:引用属性二. 资源文件引用属性 ①:定义属性 ②:配置文件中引用属性 ③:开启资源文件目录加载属性的过滤器 ④:配置maven打war包时,忽略web. ...
Spire.Cloud 在线协同编辑Word文档
协同编辑,即项目管理者在用户管理系统下,允许多人(用户)同时编辑同一Word/Excel/PPT 文档.Spire.Cloud支持的协同编辑模式包含两种: 1. 快速模式:其他编辑者可以及时看到对文档 ...
Python中Round函数：怎么解释？怎么用？
摘要:在本文中,介绍了什么是round函数以及如何从python内核中实现它.同时,还介绍舍入函数的一些缺点,以及如何纠正它们,如何在数据科学中广泛使用的库中发挥作用. Python中的舍入函数,返回 ...
云图说｜一张图看懂一站式DevOps利器——华为云DevCloud
阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要: 华为云DevCl ...
字节跳动开源数据集成引擎 BitSail 的演进历程与能力解析
导读 BitSail 是字节跳动开源数据集成引擎,支持多种异构数据源间的数据同步,并提供离线.实时.全量.增量场景下全域数据集成解决方案,目前支撑了字节内部和火山引擎多个客户的数据集成需求.经过字节跳 ...
创元集团的数智化实践这次选择了和火山引擎 VeDI 搭档
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群近日,上海创元化妆品有限公司(以下简称"创元集团")与火山引擎数智平台 VeDI 达成合作,旨 ...
ImportError: /lib64/libstdc++.so.6: version `CXXABI_1.3.8' not found
[root@localhost PaddleOCR]# strings /lib64/libstdc++.so.6 | grep 'CXXABI' CXXABI_1.3 CXXABI_1.3.1 CX ...

使用Grafana + jmx 监控 kafka3.5 的过程

使用Grafana + jmx 监控 kafka3.5 的过程

摘要

StudyFrom

部署方式

配置文件内容

重启添加相关prometheus

导入grafana的面板

总结

使用Grafana + jmx 监控 kafka3.5 的过程的更多相关文章

随机推荐

热门专题