使用 Grafana 统一监控展示-对接 Zabbix
概述
在某些情况下,Metrics 监控的 2 大顶流:
- Zabbix: 用于非容器的虚拟机环境
- Prometheus: 用于容器的云原生环境
是共存的。但是在这种情况下,统一监控展示就不太方便,本文介绍利用 Grafana 对接 Zabbix, 来作为统一监控展示端。Let's go!
在这里,主要是用到了 alexanderzobnin/grafana-zabbix 开源项目。
Grafana-Zabbix 功能亮点
Grafana-Zabbix 是 Grafana 的一个插件,允许可视化来自 Zabbix 的监控数据,并创建用于分析指标和实时监控的仪表板。 该项目的主要目标是扩展 Zabbix 的监控数据可视化功能,并提供快速、强大的方法来创建仪表板。
Grafana 与 Grafana-Zabbix 插件相结合,可以创建很棒的仪表板。 Grafana-Zabbix 有如下的功能亮点:
- 丰富的绘图功能;
- 使用 Regex 选择多个指标;
- 使用模板 (template) 变量 (variableds) 创建交互式和可重用的仪表板;
- 在带有注释 (Annotations) 的图形上显示事件
- 使用指标处理函数(平均值 Avg、中值 Median、最小值 Min、最大值 Max、乘 Multiply、汇总 Summarize、时移 Time shift、别名 Alias)转换和调整数据
- 在同一仪表板或面板中混合来自多个数据源的指标
- 在 Grafana 中创建告警
- 使用 Problems 面板显示 triggers
- 在官方库中发现和共享仪表板
快速演示
接下来我们进行一个快速演示,所有资源都安装在 K8s 中。
- (前提)安装 K3s
- 安装 Grafana
- 安装 Zabbix
- 在 Grafana 上安装 Grafana-Zabbix 插件并启用
- 在 Grafana 上配置 DB 数据源和 Zabbix 数据源
- 在 Grafana 上导入 Zabbix 仪表板并查看监控效果
- (可选)在 Grafana 上基于 Zabbix 指标配置告警
安装 K3s
curl -sfL https://rancher-mirror.oss-cn-beijing.aliyuncs.com/k3s/k3s-install.sh | INSTALL_K3S_MIRROR=cn sh -
安装完成后执行以下命令查看运行状态:
sudo systemctl status k3s.service
kubectl get node
kubectl get addons -A
安装 Grafana
使用 Helm 安装:
# 添加 Grafana repo
helm repo add grafana https://grafana.github.io/helm-charts
# 安装
helm upgrade --install my-release grafana/grafana -n grafana --create-namespace --set persistence.enabled=true --set service.type=NodePort
这里为了后续使用方便加了 2 个参数:
persistence.enabled=true
数据持久化,重启不丢失service.type=NodePort
方便通过 NodePort 直接访问 Grafana UI
安装 Zabbix
为了图省事,也直接将 Zabbix 安装在 K3s 中。
但是注意,往往在生产使用场景中,Zabbix 是安装在虚拟机环境上的,并用 Zabbix Proxy 和 Zabbix Agent 监控 Prometheus 覆盖不到的区域(典型如:非容器化的物理机、虚机;网络设备;数据库等)
直接在 Helm Chart 官方市场 - Artifact Hub 里找一个安装:
helm repo add aekondratiev https://aekondratiev.github.io/helm-charts
helm install zabbix aekondratiev/zabbix-server -n zabbix --create-namespace
这个 aekondratiev/zabbix-server helm chart 会安装以下组件:
- zabbix-server
- 和 zabbix-server 一起,以 sidecar 形式运行的 zabbix-agent
- zabbix-web
- postgresql
在 Grafana 上配置 DB 数据源和 Zabbix 数据源
Grafana-Zabbix 的数据库直连功能
这里提一下,Grafana-Zabbix 插件可以使用 MySQL、Postgres 或 InfluxDB 数据源直接从 Zabbix 数据库查询历史和趋势数据。 为了执行查询,插件仅需要对history
、history_uint
、trends
和 trends_uint
表的读访问权限。 为了使连接更安全并防止不必要数据泄漏,强烈建议只授予对表的读访问权限。 但是如果您想使用这个数据源来查询其他数据,您可以向整个 zabbix 数据库授予 SELECT 权限。 此外,所有查询都由 Grafana 服务器调用,因此您可以将连接限制为仅与 Grafana 主机连接。 下面是 MySQL 示例:
GRANT SELECT ON zabbix.* TO 'grafana'@'grafana-host' identified by 'password';
配置 DB 数据源
在 Grafana 的创建 Data Source 选项中,选择 PostgreSQL
数据源类型并提供数据库主机地址和端口(默认值为 5432
)。 填写数据库名称(通常为 zabbix
)并指定凭据。如下图所示:
之所以启用数据库直连, 是因为如果海量的 zabbix 历史和趋势数据都通过 zabbix 的 API 查询,性能会有一定问题。
在 Grafana 上安装 Grafana-Zabbix 插件并启用
进入 Grafana 容器中,并使用 grafana-cli
安装:
kubectl exec -n grafana -it <grafana-pod-name> -- /bin/sh
# 进入容器后,执行
grafana-cli plugins install alexanderzobnin-zabbix-app
# 安装完成后
exit
# 退出容器后
kubectl rollout -n grafana restart deployment <grafana-deploy-name>
Warning:
通过
grafana-cli
安装插件后需要重启生效,所以一定需要配置persistence.enabled=true
, 否则重启后数据丢失,插件还是没装上。
安装后,就可以启用插件了。
通过 Grafana 的 Nodeport (如:http://192.168.1.5:30000) 访问并登录 Grafana(密码在 K8s Secret 中), 进入 Grafana 侧面板的 plugins 界面,选择 Apps
选项卡,然后选择 Zabbix
,打开 Config
选项卡并启用插件。如下图:
配置 Zabbix 数据源
启用插件后,就可以添加 Zabbix data source 了。
要添加新的 Zabbix 数据源,单击 Add data source
并从下拉列表中选择 Zabbix
。如下图:
关键的配置项有以下几个:(其他一般不需要动)
- HTTP
- URL: Zabbix API url, 一般就是
/api_jsonrpc.php
, 如上图 1 中的:http://zabbix-web.zabbix/api_jsonrpc.php
- URL: Zabbix API url, 一般就是
- Zabbix API details
- Username 和 Password: 登录 Zabbix API 的账号密码。记得要用足够的权限。
- Trends: 如果是 Zabbix 3.x 及以上就 enable. 当显示长时间段(超过几天)时这个选项强烈建议使用,因为几天的项目历史包含海量的数据点。使用趋势将提高 Grafana 的性能。
- Direct DB Connection
- 启用并选择上面创建好的 Zabbix DB Data Source.
在 Grafana 上导入 Zabbix 仪表板并查看监控效果
之后,导入自带的几个 Zabbix 的仪表板:
接下来就能看到效果啦:
如上图,Grafana 支持灵活的表达式配置 zabbix 仪表板:
- Query Mode
- Group
- Host
- item tag
- Item: 聚合的表达式
- Functions
完全不用担心 Zabbix 上某些复杂的仪表板无法在 Grafana 上复现。
下面是官方的一些 demo:
在 Grafana 上基于 Zabbix 指标配置告警
点击侧边栏 Alerting
, 就可以创建基于 Zabbix 的告警,也可以直接在仪表板上编辑 panel 的 alert 进行配置,配置后效果如下:
以上就是本次全部的演示全过程,感兴趣的可以自己尝试复现一下。
总结
在本文中,我们介绍了利用 Grafana + 插件:Grafana-Zabbix 实现了以下效果:
- Grafana 负责展示甚至告警
- Zabbix 作为 Grafana 的其中一个数据源。
更近一步,我们的环境上,可能不止有 Zabbix 和 Prometheus 2 个数据源,甚至还会有:
- Metrics
- AWS CloudWatch
- ...
- Logging
- Tracing
在这种情况下,将所有的这些监控都视作 Grafana 的数据源,实现监控数据的统一展示和联动:
联动:
- 在 Slack 上收到 Grafana 发出的告警
- 点击链接或仪表板跳转到 Grafana 对应 Dashboard
- 在 Grafana 上查看相关 Metrics
- 在 Grafana 上跳转到 Metrics 异常时间点的日志
- 在 Grafana 上跳转到 Logs 异常的 Trace
- 发现并在 IDE 上 coding 解决问题
只能说,Grafana 为我们描绘了一个相当美妙的场景,未来可期。️️️
本文由博客一文多发平台 OpenWrite 发布!
使用 Grafana 统一监控展示-对接 Zabbix的更多相关文章
- 分布式监控系统Zabbix--使用Grafana进行图形展示
今天介绍一款高颜值监控绘图工具Grafana,在使用Zabbix监控环境中,通常我们会结合Grafana进行图形展示.Grafana默认没有zabbix作为数据源,需要手动给zabbix安装一个插 ...
- Grafana部署监控docker服务
Grafana部署监控docker服务 一.使用InfluxDB+cAdvisor+Grafana配置Docker监控 1.1Docker监控组件 1.2cAdvisor: 1.3Docker监控安装 ...
- Prometheus+Grafana企业监控系统
Prometheus+Grafana企业监控系统 作者 刘畅 实验配置: 主机名称 Ip地址 controlnode 172.16.1.70/24 slavenode1 172.16.1.71/24 ...
- k8s实战之部署Prometheus+Grafana可视化监控告警平台
写在前面 之前部署web网站的时候,架构图中有一环节是监控部分,并且搭建一套有效的监控平台对于运维来说非常之重要,只有这样才能更有效率的保证我们的服务器和服务的稳定运行,常见的开源监控软件有好几种,如 ...
- 如何监控 Tomcat?Zabbix 与 Cloud Insight 对比
JVM 监控工具有很多,像命令 jstat,jmap,jstack,jinfo 可以根据不同需求查看不同的系统信息,还有图像化界面 jconsole,都是很方便的工具.这些可以参考 JAVA自带监控工 ...
- 性能测试五十:Jmeter+Influxdb+Grafana实时数据展示系统搭建
如果用生成jtl文件再分析结果的方式的话,每一次请求就会往jtl里面写一条数据,在进行长时间的稳定性测试的时候,特别是当TPS很高的时候,写入的数据会非常的大,这个时候等稳定性测试完成,再对jtl进行 ...
- influxDB1.6版安装与配置(windows环境)、Jmeter+influxDB+Grafana性能监控
influxDB1.6版安装与配置(windows环境).Jmeter+influxDB+Grafana性能监控 来源:https://blog.csdn.net/SwTesting/article/ ...
- 四十八.监控概述 、 Zabbix基础 、 Zabbix监控服务
1.常用系统监控命令 查看内存信息 查看交换分区信息 查看磁盘信息 查看CPU信息 查看网卡信息 查看端口信息 查看网络连接信息 一般企业做监控的目的:实时报告系统状态,提前发现系统的问题. 监 ...
- Centos7.X 搭建Prometheus+node_exporter+Grafana实时监控平台
Prometheus简介 什么是 Prometheus Prometheus是一个开源监控报警系统和时序列数据库 主要功能 多维数据模型(时序由 metric 名字和 k/v 的 labels 构成) ...
- 分布式监控系统之Zabbix proxy
前文我们了解了zabbix 使用snmp和jmx信道采集数据的相关使用配置,回顾请参考https://www.cnblogs.com/qiuhom-1874/p/14029864.html:今天我们来 ...
随机推荐
- 【Azure 服务总线】Spring Cloud 的应用 使用Service Bus 引起 org.springframework.beans.BeanInstantiationException 异常,无法启动
问题描述 Spring Cloud 的应用原本正常运行,但是重新发布了一次应用后,发现使用 Service Bus 服务的应用都无法启动并报 BeanInstantiationException 异 ...
- 【2024面试刷题】一、Spring Cloud 面试题
1.什么是 Spring Cloud? Spring Cloud是一系列框架的有序集合.它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发,如 服务发现注册.配置中心.智能路 ...
- Codeforces Round 170 (Div. 1)A. Learning Languages并查集
如果两个人会的语言中有共同语言那么他们之间就可以交流,并且如果a和b可以交流,b和c可以交流,那么a和c也可以交流,具有传递性,就容易联想到并查集,我们将人和语言看成元素,一个人会几种语言的话,就将这 ...
- Scriban语言手册中文版
Scriban是一个快速.强大.安全且轻量级的模板引擎,同时兼容liquid语法规则. 项目地址:https://github.com/scriban/scriban 这个文档是语言语法的中文翻译 原 ...
- vscode 提取扩展时出错 XHR failed
vscode 提取扩展时出错 XHR failed 起因 vscode 安装 Bracket Pair Color DLW 插件,商店打不开了 解决方案 打开 hosts 添加 13.107.42.1 ...
- 可穿戴心电ECG监测的技术路径及特点
在传统的医疗设备中,监测心跳速率和心脏活动是经由测量电生理讯号与心电图 (ECG) 来完成的,需要将电极连接到身体来量测心脏组织中所引发电气活动的信号.常见的设备用医院的心电图机,长期监护的动态心电仪 ...
- 在salesforce中如何获取Security Token
Trailhead练习Soap API使用Soap UI时,需要Security Token才能登录,在Lightning一直找不到,后来切换到Classic才找到.现在提供一个简单粗暴的方式,快速定 ...
- 《TencentNCNN系列》 之bin文件(网络参数文件)格式分析
PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 前置说明 本文作为本人csdn blog的主站的备份.(Bl ...
- 人人都是艺术家!AI工具Doodly让潦草手绘变精美画作
AI绘画界太卷了,一天一个新东西,不久前刚给大家介绍了可以一秒出图的SDXL-Turbo,今天来聊一聊另一位重磅选手Doodly 有用过Stable Diffuison的小伙伴都知道,想要生成一张高质 ...
- windows 10 wsl 环境 docker 无法正常启动 -The system cannot find the file specified
错误信息: error during connect: in the default daemon configuration on Windows, the docker client must b ...