Zabbix监控笔记
了解zabbix,有必要了聊一下监控系统相关内容
企业中常用的开源监视系统目前有 cacti、Nagios、Open-Falcon、zabbix、prometheus等
使用监控系统的目的在于
/1、能够及时发现故障、及时处理、降低损失
/2、另一方面降低运维人员的工作量
/3、监控对象几乎涵盖所有服务程序 { 服务器的硬件:CPU使用率 / 负载、内存使用率 / 空闲情况、磁盘使用情况等
服务器性能:带宽 IO、磁盘 IO、进程等
网络服务:不同服务的运行情况等
当前业务:访问量、发货状态、成交量、正在支付的用户量等
网络设备,及应用程序等 }
为什么需要对各类系统进行监控?
在系统构建时,通常不允许未被监控的系统或应用上线,因为未被监控的系统存在不可预知性,故障未知性等不稳定因素,且无法及时被发现并排除。这对整个架构或系统都是很大的风险隐患,所以原则上需要对整个架构或系统进行监控,随时监测各方面指标正常与否,提高系统稳定性。
一个完整的监控系统包括:
• 数据采样 :周期性的获取某个被监测指标的相关数据
• 数据存储 :将采集的数据存储在指定的存储系统,zabbix默认是MySQL
• 数据展示 :直观的展示在用户面前,可将采集的数据做二次处理,做成各类图形
• 报警 :当监控指标出现异常时需要实时发出告警信息,必要情况可自行修复等
Zabbix
基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案,目前大部分企业公司均有使用
官方手册https://www.zabbix.com/documentation/4.0/zh/manual……支持中文版
相关特性
zabbix 是一个高度集成的网络监控套件,通过一个软件包就可提供诸多特性
/1、数据收集 :通过 snmp 、ssh 、telnet 、agent 、ipmi 、jmx 、等通道采集被监控数据的数据。详情点击
/2、实时绘图:展示,读取数据绘图,支持 graph 、map 、screen 、slide show
/3、告警:邮件,短息,微信,钉钉等通讯软件
/4、数据存储:mysql 、pgsql 、时间序列数据库
/5、灵活阈值定义:zabbix中称为触发器 trigger
/6、配置简单:一次配置,终生监控
/7、网络自动发现:自动发现网络设备,agent 自动注册
/8、WEB 接口:使用PHP编写,访问快速无障碍
/9、二进制守护进程:高性能,低内存消耗,易移植
等
常用组件
• Server 服务端,数据集成地
• Agent 客户端,收集数据
• Proxy 代理,相当于中转站,需要把收集到的数据提交 / 被提交到 Server
• Database 数据存储,配置信息及采集的数据
• Web GUI 提供的WEB界面
工作原理
zabbix agent需要安装到被监控的主机上,它负责定期收集各项数据,并发送到zabbix server端;
zabbix server将数据存储到数据库中,zabbix web根据数据在前端进行展现和绘图。
这里agent收集数据分为主动和被动两种模式:
主、agent请求server获取主动的监控项列表,并主动将监控项内需要检测的数据提交给server/proxy
被、server向agent请求获取监控项的数据,agent返回数据
工作进程
• zabbix_get 单独使用命令,用来故障排错
• zabbix_sender 发送数据给server或proxy,用于耗时较长的检查
• zabbix_java_gateway 2.0后引入,Java 网关,主动的获取数据
• zabbix_agentd 客户端守护进程
• zabbix_proxy 代理守护进程
• zabbix_server 服务端守护进程
相关概念
host • 主机 要监控的网络设备,可由IP或DNS名称指定
host group • 主机组 主机的逻辑容器,可以包含主机和模板,但同一个组织内的主机和模板不能互相链接
item • 监控项 一个特定监控指标的相关的数据;item是zabbix进行数据收集的核心,相对某个监控对象,每个item都由"key"标识;
trigger • 触发器 一个表达式,用于评估某监控对象的特定item内接收到的数据是否在合理范围内,也就是阈值
event • 事件 触发一个值得关注的事情,比如触发器状态转变,新的agent或重新上线的agent的自动注册等
action • 动作 指对于特定事件事先定义的处理方法,如发送通知,何时执行操作
escalation • 报警升级 发送警报或者执行远程命令的自定义方案
media • 媒介 发送通知的手段或者通道,如Email、Jabber或者SMS等
notification • 通知 通过选定的媒介向用户发送的有关某事件的信息
template • 模版 用于快速定义被监控主机的预设条目集合,通常包含了item、trigger、graph、等,模板可以直接链接至某个主机
application • 应用 一组item的集合
web scennario • web场景 用于检测web站点可用性的一个或多个HTTP请求
frontend • 前端 Zabbix的web接口
监控架构
根据网络环境、监控规模等,分以下三种架构
/1、server-client 直接由zabbix server和zabbix agentd之间进行数据交互,适用于网络比较简单,设备比较少的监控环境
/2、server-proxy-client server+proxy+agentd建立,一般适用于跨机房、跨网络的中型网络架构的监控
/3、master-node-client 每个node同时也是一个server端,node下面可以接proxy,也可以直接接client 。node有自已的配置文件和数据库,将配置信息和监控数据向master同步
适用于跨网络、跨机房、设备较多的大型环境
Zabbix监控笔记的更多相关文章
- zabbix学习笔记:zabbix监控之短信报警
zabbix学习笔记:zabbix监控之短信报警 zabbix的报警方式有多种,除了常见的邮件报警外,特殊情况下还需要设置短信报警和微信报警等额外方式.本篇文章向大家介绍短信报警. 短信报警设置 短信 ...
- Linux实战教学笔记50:Zabbix监控平台3.2.4(二)深入理解zabbix
https://www.cnblogs.com/chensiqiqi/p/9162986.html 一,Zabbix Web操作深入 1.1 Zabbix Web下的主机和模版以及监控项的添加方式 ( ...
- Linux实战教学笔记49:Zabbix监控平台3.2.4(一)搭建部署与概述
https://www.cnblogs.com/chensiqiqi/p/9162986.html 一,Zabbix架构 zabbix 是一个基于 WEB 界面的提供分布式系统监视以及网络监视功能的企 ...
- Linux实战教学笔记51:Zabbix监控平台3.2.4(三)生产环境案例
https://www.cnblogs.com/chensiqiqi/p/9162986.html 一,Zabbix生产环境监测案例概述 1.1 项目规划 [x] :主机分组 交换机 Nginx To ...
- zabbix笔记_008 zabbix监控交换机路由器
zabbix监控交换机路由器 要监控路由器交换机,需要使用到SNMP协议 SNMP是一个简单网络管理协议,他基于C/S模型实现的监控和管理. 服务器安装SNMP: yum -y install net ...
- 跟着ttlsa一起学zabbix监控呗
本章转载至:http://www.ttlsa.com/zabbix/follow-ttlsa-to-study-zabbix/ 虽然接触zabbix时间很长,但是中间相当一段时间没去配置,这次算是重新 ...
- Zabbix监控系统部署:源码安装
1. 概述1.1 基础环境2. 部署过程2.1 创建用户组2.2 下载源码解压编译安装2.2.1 下载源码解压2.2.2 YUM安装依赖环境2.2.3 编译安装最新版curl2.2.4 更新GNU构建 ...
- Zabbix学习笔记(yum源安装)
Zabbix学习笔记(yum源安装) 链接:https://pan.baidu.com/s/19RXhumkB-ulpI4BGOa5b_A 提取码:115h 复制这段内容后打开百度网盘手机App,操作 ...
- 使用Zabbix监控Oracle数据库
Orabbix介绍 监控Oracle数据库我们需要安装第三方提供的Zabbix插件,我们先测试比较有名的Orabbix,http://www.smartmarmot.com/product/orabb ...
随机推荐
- IDEA 中项目代码修改后不自动生效,需要执行 mvn clean install 才生效
问题描述 之前项目运行好好的,代码修改完之后会自动编译,编程体验很好. 有一天发现每次修改代码后需要重新使用mvn clean install命令重新编译,异常麻烦. 检查了 IDEA 的配置,已经配 ...
- 全宇宙首个.NET5+Vue.js前后端分离以及业务模块化快速开发框架【NetModular】发布~
最近.Net圈子很热闹啊,我也来凑凑,今天中午耗时长达半小时,把NetModular升级到了.NET5,详情查看分支https://github.com/iamoldli/NetModular/tre ...
- Python基础知识,新手入门看过来
1 下载和安装Python 在开始编程之前,你需要安装Python解析器软件(这里你可能需要找人帮忙).解析器是一个可以理解你用Python语言写的指令的程序.如果没有解析器,你的计算机不会理解这些指 ...
- java如何实现一个Future
实现Futrue接口 public class MsgFuture<V> implements java.util.concurrent.Future<V> { ... ... ...
- 关于天线长度及LC值的计算
一.天线长度与波长 1.天线最佳长度计算 理论和实践证明,当天线的长度为无线电信号波长的1/4时,天线的发射和接收转换效率最高.因此,天线的长度将根据所发射和接收信号的频率即波长来决定.只要知道对应发 ...
- 【DeepLearning】LeNet-5
手写字体识别模型LeNet5诞生于1994年,是最早的卷积神经网络之一.原文地址为Gradient-Based Learning Applied to Document Recognition,感谢网 ...
- 【总结】springcloud
一.spirngcloud概述 1.springcloud是什么? spring cloud是一个一站式的开发分布式系统的框架,为开发人员提供了快速构建分布式系统中一些常见模式的工具(如:配置管理,服 ...
- Java学习的第四十八天
1.例8.4找出整形数组中的最大值 import java.util.Scanner; public class Cjava { public static void main(String[]arg ...
- vue3.0-如何切换路由-路由模式ts
如何更换路由模式 vue3版本如何切换路由模式?(注:更改后要重启下项目才能看到效果.) 博主,我搜了大半天的,你是怎么找到的? 如下图可看到
- ts流中的pcr与pts计算与逆运算
mpeg2ts文件格式中有pcr和pts的概念,其代码含义如下: PCR(Program Clock Reference)--指示系统时钟本身的瞬时值的时间标签称为节目参考时钟标签(PCR). PTS ...