一.分布式架构 相信使用zabbix的大神都熟悉他的分布式架构,分布式的优势相当明显,分而治之.比如目前我的架构图如下: 那么,对将要接入监控系统的任何一个agent如何快速定位,并进行接入呢?  问题分析: 1.目标IP定位 2.目标IP定位后,可能有些是纯内网环境(比如DB机器) 3.proxy管辖范围 4.被管辖目标和管辖者范围确定后,具体用什么方法实现? 解决办法: 1.目标IP基本上是可控的,因为我们自己有哪些IP网段,在CMDB里面一查便知: 2.对于纯内网环境,由于机器无法直接出外…
一.环境 zabbix版本:3.0 二.脚本说明 .├── rabbitmq.template.xml   模板文件├── scripts  │   └── rabbitmq│   ├── api.py   主要脚本,通过rabbitMQ API获取数据和发送数据│   ├── list_rabbit_nodes.sh   │   ├── list_rabbit_queues.sh│   ├── list_rabbit_shovels.sh│   └── rabbitmq-status.sh├─…
一.环境准备 1.安装kafka Step 1: 下载代码 你可以登录Apache kafka 官方下载.http://kafka.apache.org/downloads.html备注:2.11-1.1.0版本才与JDK1.7兼容,否则更高版本需要JDK1.8 Step 2: 启动服务 运行kafka需要使用Zookeeper,所以你需要先启动Zookeeper,如果你没有Zookeeper,你可以使用kafka自带打包和配置好的Zookeeper(PS:在kafka包里). //这是前台启动…
一.监控思路 通过zabbix trapper方式监控,之前看到网友们都是通过定时任务进行主动上传数据,但是,zabbix还有另外一神器--自动发现,也能达到同样的功能. 二.实现步骤 1.准备脚本 https://github.com/loveqx/zabbix-doc/blob/master/zabbix-scripts/zabbix-template-zookeeper/zookeeper-monitor-lld.py 2.安装依赖包 #Centos6 rpm -ivh http://re…
3.3.1 zabbix proxy安装(源码方式) 1.创建目录 mkdir -p /usr/local/zabbix 2.安装必要软件 yum install -y fping(若安装不成功) 或 wget http://pkgs.repoforge.org/fping/fping-3.1-1.el6.rf.i686.rpm yum install -y gcc make cmake mysql-server mysql-devel php php-gd php-devel php-mysq…
一.基础篇(安装和接入) Zabbix实战-简易教程--总流程  Zabbix实战-简易教程--整体架构图 Zabbix实战-简易教程--DB安装和表分区 Zabbix实战-简易教程--Server端安装 Zabbix实战-简易教程--Proxy和Agent端安装(源码和yum方式) Zabbix实战-简易教程--Server端高可用 Zabbix实战-简易教程--Agent批量快速接入 二.进阶篇(使用和配置) Zabbix实战-简易教程--添加Host Zabbix实战-简易教程--监控项(…
3.4 server前端高可用    至此,单台Zabbix server环境已经搭建完成,为了达到高可用效果,我们需要通过2台服务器之间通过HA软件进行探测,一旦检测到主的server挂掉后,从的server会立即顶替.我们这里采用keepalived软件来实现. 具体架构参考:Zabbix实战-简易教程(2)--整体架构图 3.4.1 Keepalived安装 直接yum安装即可 Yum install keepalived 3.4.2 keepalived配置 Master上的keepal…
附上本系列文章链接 打造云原生大型分布式监控系统(一): 大规模场景下 Prometheus 的优化手段 打造云原生大型分布式监控系统(二): Thanos 架构详解 打造云原生大型分布式监控系统(二): Thanos 部署与实践 附上本系列完整视频 打造云原生大型分布式监控系统(一): 大规模场景下 Prometheus 的优化手段 打造云原生大型分布式监控系统(二): Thanos 架构详解 打造云原生大型分布式监控系统(三): Thanos 部署与实践…
一.术语 1.1 Item概念 Item是从主机里面获取的所有数据.通常情况下 item称为监控项,例如我们host加入了 zabbix 监控,我们需要监控它的内存.CPU信息,那么获取的CPU或内存的这个元素就是 item,也就是监控项. 每个item 由 key[参数1,参数2,参数3,参数n]组成. 比如:监控项中需要获取主机信息,则需要一个对应的监控 key:system.hostname.如果是获取网卡流量,那么获取网卡这个监控项需要 key:net.if.in 或者 net.if.o…
概述 继上一篇 Thanos 部署与实践 发布半年多之后,随着技术的发展,本系列又迎来了一次更新.本文将介绍如何结合 Kvass 与 Thanos,来更好的实现大规模容器集群场景下的监控. 有 Thanos 不够吗 ? 有同学可能会问,Thanos 不就是为了解决 Prometheus 的分布式问题么,有了 Thanos 不就可以实现大规模的 Prometheus 监控了吗?为什么还需要个 Kvass? Thanos 解决了 Prometheus 的分布式存储与查询的问题,但没有解决 Prome…