概述

在某些情况下,Metrics 监控的 2 大顶流:

  • Zabbix: 用于非容器的虚拟机环境
  • Prometheus: 用于容器的云原生环境

是共存的。但是在这种情况下,统一监控展示就不太方便,本文介绍利用 Grafana 对接 Zabbix, 来作为统一监控展示端。Let's go!

在这里,主要是用到了 alexanderzobnin/grafana-zabbix 开源项目。

Grafana-Zabbix 功能亮点

Grafana-Zabbix 是 Grafana 的一个插件,允许可视化来自 Zabbix 的监控数据,并创建用于分析指标和实时监控的仪表板。 该项目的主要目标是扩展 Zabbix 的监控数据可视化功能,并提供快速、强大的方法来创建仪表板。

Grafana 与 Grafana-Zabbix 插件相结合,可以创建很棒的仪表板。 Grafana-Zabbix 有如下的功能亮点:

  • 丰富的绘图功能;
  • 使用 Regex 选择多个指标;
  • 使用模板 (template) 变量 (variableds) 创建交互式和可重用的仪表板;
  • 在带有注释 (Annotations) 的图形上显示事件
  • 使用指标处理函数(平均值 Avg、中值 Median、最小值 Min、最大值 Max、乘 Multiply、汇总 Summarize、时移 Time shift、别名 Alias)转换和调整数据
  • 在同一仪表板或面板中混合来自多个数据源的指标
  • 在 Grafana 中创建告警
  • 使用 Problems 面板显示 triggers
  • 在官方库中发现和共享仪表板

快速演示

接下来我们进行一个快速演示,所有资源都安装在 K8s 中。

  1. (前提)安装 K3s
  2. 安装 Grafana
  3. 安装 Zabbix
  4. 在 Grafana 上安装 Grafana-Zabbix 插件并启用
  5. 在 Grafana 上配置 DB 数据源和 Zabbix 数据源
  6. 在 Grafana 上导入 Zabbix 仪表板并查看监控效果
  7. (可选)在 Grafana 上基于 Zabbix 指标配置告警

安装 K3s

curl -sfL https://rancher-mirror.oss-cn-beijing.aliyuncs.com/k3s/k3s-install.sh | INSTALL_K3S_MIRROR=cn sh -

安装完成后执行以下命令查看运行状态:

sudo systemctl status k3s.service
kubectl get node
kubectl get addons -A

安装 Grafana

使用 Helm 安装:

# 添加 Grafana repo
helm repo add grafana https://grafana.github.io/helm-charts # 安装
helm upgrade --install my-release grafana/grafana -n grafana --create-namespace --set persistence.enabled=true --set service.type=NodePort

这里为了后续使用方便加了 2 个参数:

  • persistence.enabled=true 数据持久化,重启不丢失
  • service.type=NodePort 方便通过 NodePort 直接访问 Grafana UI

安装 Zabbix

为了图省事,也直接将 Zabbix 安装在 K3s 中。

但是注意,往往在生产使用场景中,Zabbix 是安装在虚拟机环境上的,并用 Zabbix Proxy 和 Zabbix Agent 监控 Prometheus 覆盖不到的区域(典型如:非容器化的物理机、虚机;网络设备;数据库等)

直接在 Helm Chart 官方市场 - Artifact Hub 里找一个安装:

helm repo add aekondratiev https://aekondratiev.github.io/helm-charts
helm install zabbix aekondratiev/zabbix-server -n zabbix --create-namespace

这个 aekondratiev/zabbix-server helm chart 会安装以下组件:

  • zabbix-server
  • 和 zabbix-server 一起,以 sidecar 形式运行的 zabbix-agent
  • zabbix-web
  • postgresql

在 Grafana 上配置 DB 数据源和 Zabbix 数据源

Grafana-Zabbix 的数据库直连功能

这里提一下,Grafana-Zabbix 插件可以使用 MySQL、Postgres 或 InfluxDB 数据源直接从 Zabbix 数据库查询历史和趋势数据。 为了执行查询,插件仅需要对historyhistory_uinttrendstrends_uint 表的读访问权限。 为了使连接更安全并防止不必要数据泄漏,强烈建议只授予对表的读访问权限。 但是如果您想使用这个数据源来查询其他数据,您可以向整个 zabbix 数据库授予 SELECT 权限。 此外,所有查询都由 Grafana 服务器调用,因此您可以将连接限制为仅与 Grafana 主机连接。 下面是 MySQL 示例:

GRANT SELECT ON zabbix.* TO 'grafana'@'grafana-host' identified by 'password';

配置 DB 数据源

在 Grafana 的创建 Data Source 选项中,选择 PostgreSQL 数据源类型并提供数据库主机地址和端口(默认值为 5432)。 填写数据库名称(通常为 zabbix)并指定凭据。如下图所示:

之所以启用数据库直连, 是因为如果海量的 zabbix 历史和趋势数据都通过 zabbix 的 API 查询,性能会有一定问题。

在 Grafana 上安装 Grafana-Zabbix 插件并启用

进入 Grafana 容器中,并使用 grafana-cli 安装:

kubectl exec -n grafana -it <grafana-pod-name> -- /bin/sh

# 进入容器后,执行
grafana-cli plugins install alexanderzobnin-zabbix-app # 安装完成后
exit # 退出容器后
kubectl rollout -n grafana restart deployment <grafana-deploy-name>

Warning:

通过 grafana-cli 安装插件后需要重启生效,所以一定需要配置 persistence.enabled=true, 否则重启后数据丢失,插件还是没装上。

安装后,就可以启用插件了。

通过 Grafana 的 Nodeport (如:http://192.168.1.5:30000) 访问并登录 Grafana(密码在 K8s Secret 中), 进入 Grafana 侧面板的 plugins 界面,选择 Apps 选项卡,然后选择 Zabbix ,打开 Config 选项卡并启用插件。如下图:

配置 Zabbix 数据源

启用插件后,就可以添加 Zabbix data source 了。

要添加新的 Zabbix 数据源,单击 Add data source 并从下拉列表中选择 Zabbix。如下图:

关键的配置项有以下几个:(其他一般不需要动)

  • HTTP

  • Zabbix API details
    • UsernamePassword: 登录 Zabbix API 的账号密码。记得要用足够的权限。
    • Trends: 如果是 Zabbix 3.x 及以上就 enable. 当显示长时间段(超过几天)时这个选项强烈建议使用,因为几天的项目历史包含海量的数据点。使用趋势将提高 Grafana 的性能。
  • Direct DB Connection
    • 启用并选择上面创建好的 Zabbix DB Data Source.

在 Grafana 上导入 Zabbix 仪表板并查看监控效果

之后,导入自带的几个 Zabbix 的仪表板:

接下来就能看到效果啦:

如上图,Grafana 支持灵活的表达式配置 zabbix 仪表板:

  • Query Mode
  • Group
  • Host
  • item tag
  • Item: 聚合的表达式
  • Functions

完全不用担心 Zabbix 上某些复杂的仪表板无法在 Grafana 上复现。

下面是官方的一些 demo:

在 Grafana 上基于 Zabbix 指标配置告警

点击侧边栏 Alerting, 就可以创建基于 Zabbix 的告警,也可以直接在仪表板上编辑 panel 的 alert 进行配置,配置后效果如下:

以上就是本次全部的演示全过程,感兴趣的可以自己尝试复现一下。

总结

在本文中,我们介绍了利用 Grafana + 插件:Grafana-Zabbix 实现了以下效果:

  • Grafana 负责展示甚至告警
  • Zabbix 作为 Grafana 的其中一个数据源。

更近一步,我们的环境上,可能不止有 Zabbix 和 Prometheus 2 个数据源,甚至还会有:

  • Metrics

    • AWS CloudWatch
    • ...
  • Logging
  • Tracing

在这种情况下,将所有的这些监控都视作 Grafana 的数据源,实现监控数据的统一展示和联动:

联动:

  1. 在 Slack 上收到 Grafana 发出的告警
  2. 点击链接或仪表板跳转到 Grafana 对应 Dashboard
  3. 在 Grafana 上查看相关 Metrics
  4. 在 Grafana 上跳转到 Metrics 异常时间点的日志
  5. 在 Grafana 上跳转到 Logs 异常的 Trace
  6. 发现并在 IDE 上 coding 解决问题

只能说,Grafana 为我们描绘了一个相当美妙的场景,未来可期。️️️

本文由博客一文多发平台 OpenWrite 发布!

使用 Grafana 统一监控展示-对接 Zabbix的更多相关文章

  1. 分布式监控系统Zabbix--使用Grafana进行图形展示

      今天介绍一款高颜值监控绘图工具Grafana,在使用Zabbix监控环境中,通常我们会结合Grafana进行图形展示.Grafana默认没有zabbix作为数据源,需要手动给zabbix安装一个插 ...

  2. Grafana部署监控docker服务

    Grafana部署监控docker服务 一.使用InfluxDB+cAdvisor+Grafana配置Docker监控 1.1Docker监控组件 1.2cAdvisor: 1.3Docker监控安装 ...

  3. Prometheus+Grafana企业监控系统

    Prometheus+Grafana企业监控系统 作者 刘畅 实验配置: 主机名称 Ip地址 controlnode 172.16.1.70/24 slavenode1 172.16.1.71/24 ...

  4. k8s实战之部署Prometheus+Grafana可视化监控告警平台

    写在前面 之前部署web网站的时候,架构图中有一环节是监控部分,并且搭建一套有效的监控平台对于运维来说非常之重要,只有这样才能更有效率的保证我们的服务器和服务的稳定运行,常见的开源监控软件有好几种,如 ...

  5. 如何监控 Tomcat?Zabbix 与 Cloud Insight 对比

    JVM 监控工具有很多,像命令 jstat,jmap,jstack,jinfo 可以根据不同需求查看不同的系统信息,还有图像化界面 jconsole,都是很方便的工具.这些可以参考 JAVA自带监控工 ...

  6. 性能测试五十:Jmeter+Influxdb+Grafana实时数据展示系统搭建

    如果用生成jtl文件再分析结果的方式的话,每一次请求就会往jtl里面写一条数据,在进行长时间的稳定性测试的时候,特别是当TPS很高的时候,写入的数据会非常的大,这个时候等稳定性测试完成,再对jtl进行 ...

  7. influxDB1.6版安装与配置(windows环境)、Jmeter+influxDB+Grafana性能监控

    influxDB1.6版安装与配置(windows环境).Jmeter+influxDB+Grafana性能监控 来源:https://blog.csdn.net/SwTesting/article/ ...

  8. 四十八.监控概述 、 Zabbix基础 、 Zabbix监控服务

     1.常用系统监控命令 查看内存信息 查看交换分区信息 查看磁盘信息 查看CPU信息 查看网卡信息 查看端口信息 查看网络连接信息   一般企业做监控的目的:实时报告系统状态,提前发现系统的问题. 监 ...

  9. Centos7.X 搭建Prometheus+node_exporter+Grafana实时监控平台

    Prometheus简介 什么是 Prometheus Prometheus是一个开源监控报警系统和时序列数据库 主要功能 多维数据模型(时序由 metric 名字和 k/v 的 labels 构成) ...

  10. 分布式监控系统之Zabbix proxy

    前文我们了解了zabbix 使用snmp和jmx信道采集数据的相关使用配置,回顾请参考https://www.cnblogs.com/qiuhom-1874/p/14029864.html:今天我们来 ...

随机推荐

  1. 【Azure 服务总线】Spring Cloud 的应用 使用Service Bus 引起 org.springframework.beans.BeanInstantiationException 异常,无法启动

    问题描述 Spring Cloud 的应用原本正常运行,但是重新发布了一次应用后,发现使用 Service Bus 服务的应用都无法启动并报 BeanInstantiationException  异 ...

  2. 【2024面试刷题】一、Spring Cloud 面试题

    1.什么是 Spring Cloud? Spring Cloud是一系列框架的有序集合.它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发,如 服务发现注册.配置中心.智能路 ...

  3. Codeforces Round 170 (Div. 1)A. Learning Languages并查集

    如果两个人会的语言中有共同语言那么他们之间就可以交流,并且如果a和b可以交流,b和c可以交流,那么a和c也可以交流,具有传递性,就容易联想到并查集,我们将人和语言看成元素,一个人会几种语言的话,就将这 ...

  4. Scriban语言手册中文版

    Scriban是一个快速.强大.安全且轻量级的模板引擎,同时兼容liquid语法规则. 项目地址:https://github.com/scriban/scriban 这个文档是语言语法的中文翻译 原 ...

  5. vscode 提取扩展时出错 XHR failed

    vscode 提取扩展时出错 XHR failed 起因 vscode 安装 Bracket Pair Color DLW 插件,商店打不开了 解决方案 打开 hosts 添加 13.107.42.1 ...

  6. 可穿戴心电ECG监测的技术路径及特点

    在传统的医疗设备中,监测心跳速率和心脏活动是经由测量电生理讯号与心电图 (ECG) 来完成的,需要将电极连接到身体来量测心脏组织中所引发电气活动的信号.常见的设备用医院的心电图机,长期监护的动态心电仪 ...

  7. 在salesforce中如何获取Security Token

    Trailhead练习Soap API使用Soap UI时,需要Security Token才能登录,在Lightning一直找不到,后来切换到Classic才找到.现在提供一个简单粗暴的方式,快速定 ...

  8. 《TencentNCNN系列》 之bin文件(网络参数文件)格式分析

    PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 前置说明   本文作为本人csdn blog的主站的备份.(Bl ...

  9. 人人都是艺术家!AI工具Doodly让潦草手绘变精美画作

    AI绘画界太卷了,一天一个新东西,不久前刚给大家介绍了可以一秒出图的SDXL-Turbo,今天来聊一聊另一位重磅选手Doodly 有用过Stable Diffuison的小伙伴都知道,想要生成一张高质 ...

  10. windows 10 wsl 环境 docker 无法正常启动 -The system cannot find the file specified

    错误信息: error during connect: in the default daemon configuration on Windows, the docker client must b ...