Nagios页面介绍(四)
四、nagios页面介绍
Nagios 4.0.8版本登录后图片
General(常用)
Home(主页)和Documentation(文档)内容连接nagios官网,主要介绍nagios的内容。
Current Status
Tactical Overview (总览)
这个页面上显示了所有主机的状态信息可以看到停机own、不可达Unreachble、UP启动、等待返回状态pending。同时列出了所有服务的状态信息。所谓服务并非单纯指狭义上的Windows的系统服务,而是该设备上的进程、资源、系统服务等等的一个统称。
Network Outages显示网络中断的统计,如果有中断信息会在下面显示
Network Health显示网络健康状况,会列出主机和服务状况,以绿色进度条显示,进度条满格显示代表主机和服务状况正常。
Hosts:
down代表宕机
Unreachable代表不可到达
UP代表主机在线
Pending表示该主机刚被纳入监控范围,等待第一次检测结果返回中。
Services:
Critical代表紧急告警
Warning代表警告告警
Unknown代表未知告警
Ok代表服务运行正常
Pending代表待定
Monitoring Features:
Flap Detection代表抖动检测;
Notifications代表对外发布告警信息
Event Handlers代表事件句柄
Active Checks代表主动检测
Passive Checks代表被动检查
Map(拓扑图)
这个页面是2D网络拓扑图,列出所有hosts中的状态
通过拓扑图可以查看当前主机的一些信息,包括地址、主机名、状态、多少服务以及服务是否正常
Hosts (主机)
Host 显示的是主机详细信息,用ping探测的。如下图所示:
- Current Network Status:列出当前网络的状态,上次更新的日期以及登录的用户名称等;
- Host Status Totals:显示主机状态的统计信息,相应的统计信息会在下面列出,具体包括:UP,DOWN,Unreachable,Pending,All Problems,All Types; 可双击相应的选项进入查看。
- Service Status Totals:显示服务状态的统计信息,相应的信息会在下面列出;具体包括:UP,DOWN,Unreachable,Critical,Pending,All Problems,All Types;可双击相应的选项进入查看。
- Host Status Details For All Hosts:列出所有的主机的详细信息,包括:Host,Status,Last check,Duration,Status Information。如果想查看相关信息,我们可以点击Host或Service列出的主机和服务名称进行查看。
- Host:列出所有的主机名称。
- Status:列出所有主机的存活状态。
- Last Check:上次检测时间。
- Duration:运行持续时间。
- Status Information:相关状态信息。
点击上图中Host所列的任意一主机名称如下图所示:
针对图中“Host State Information”所列字段信息的说明:
- Host Status:主机存活的状态,UP代表存活,DOWN代表宕机。
- Status Information:状态信息
- Performance Data:性能数据信息
- Current Attempt:目前的尝试次数
- Last Check Time:最后检测时间
- Check Type:检测类型
- Check Latency/Duration:延时检测/持续检测
- Next Scheduled Active Check:下次计划主动检测时间
- Last State Change:上次状态改变时间
- Last notification:上次告警时间
- Is This Host Flapping:主机是否抖动,即反复出现故障,或刚从故障中恢复。
- In Scheduled Downtime:是否计划宕机
- Last Update:上次更新时间
针对图中“Host Commands”所列字段信息的说明:
- Disable active checks of this host:不主动检测这台主机
- Re-schedule the next check of this host:下一次计划检测这个主机,选中后可以自定义时间和是否强制检测,提交后执行即生效。这里默认的检测时间是距当前时间
- Submit passive check result for this host:为这个主机提交被动检测结果
- Stop accepting passive checks for this host:停止接受被动检测此主机
- Stop obsessing over this host:停止被困扰的主机
- Disable notifications for this host:不显示主机告警通知
- Send custom host notification:发送自定义主机告警
- Schedule downtime for this host:为主机提供停机功能,此功能为主机自定义停机时间,维护主机或者割接时常用到此功能,在指定的停机时间内,将不会发出通知;当预定的停机时间到期时,将发出通知些主机。里面会有起始时间和终止时间,可以选择固定或弹性停机,此功能需重点掌握,比较常用。
- Schedule downtime for allservice on this host:为该主机的所有服务提供停机功能,此功能为该主机的所有服务自定义停机时间,维护主机或者割接时常用到此功能,在指定的停机时间内,将不会发出通知;当预定的停机时间到期时,将发出通知些服务。里面会有起始时间和终止时间,可以选择固定或弹性停机,此功能需重点掌握,比较常用。
- Disable notifications for all services on this host:本机上的所有服务不启用告警
- Enable notifications for all services on this host:本机上的所有服务启用告警
- Schedule a check of all services on this host:计划为本机检测所有的服务,用来排定下次检查所有服务指定的主机,可以强制检查。
- Disable checks of all services on this host:禁用为本机检测所有的服务。
- Enable checks of all services on this host:与上面的相反。
- Disable event handler for this host:用来暂时阻止Nagios主机运行事件处理程序
- Disable flap detection for this host:停止本机抖动检测
Services(服务)
Services 显示的是所有服务详细信息。如下图所示:
- Current Network Status:列出当前网络的状态,上次更新的日期以及登录的用户名称等;
- Host Status Totals:显示主机状态的统计信息,相应的统计信息会在下面列出,具体包括:UP,DOWN,Unreachable,Pending,All Problems,All Types; 可双击相应的选项进入查看。
- Service Status Totals:显示服务状态的统计信息,相应的信息会在下面列出;具体包括:UP,DOWN,Unreachable,Critical,Pending,All Problems,All Types;可双击相应的选项进入查看。
- Service Status Details For All Hosts:列出所有的主机和服务相关状况的详细信息,包括:Host,Service,Status,Last check,Duration, Attempt,Status Information。如果想查看相关信息,我们可以点击Host或Service列出的主机和服务名称进行查看。
点击上图中Host所列的任意一Servive名称如下图所示:
针对图中“Service State Information”所列字段信息的说明:
- Current Status:服务的状态,OK代表正常。
- Status Information:状态信息
- Performance Data:性能数据信息
- Current Attempt:目前的尝试次数
- Last Check Time:最后检测时间
- Check Type:检测类型
- Check Latency/Duration:延时检测/持续检测
- Next Scheduled Active Check:下次计划主动检测时间
- Last State Change:上次状态改变时间
- Last notification:上次告警时间
- Is This Host Flapping:主机是否抖动,即反复出现故障,或刚从故障中恢复。
- In Scheduled Downtime:是否计划宕机
- Last Update:上次更新时间
针对图中“Service Commands”所列字段信息的说明:
- Disable active checks of this service:不主动检测这个服务
- Re-schedule the next check of this service:下一次计划检测这个服务,选中后可以自定义时间和是否强制检测,提交后执行即生效。这里默认的检测时间是距当前时间
- Submit passive check result for this service:为这个服务提交被动检测结果
- Stop accepting passive checks for this service:停止接受被动检测此服务
- Stop obsessing over this service:停止被困扰的服务
- Disable notifications for this service:不显示本服务告警通知
- Send custom host notification:发送自定义主机告警
- Schedule downtime for this service:为本服务提供停机功能,此功能为服务自定义停机时间,维护主机或者割接时常用到此功能,在指定的停机时间内,将不会发出通知;当预定的停机时间到期时,将发出通知些主机。里面会有起始时间和终止时间,可以选择固定或弹性停机,此功能需重点掌握,比较常用。
- Disable event handler for this service:用来暂时阻止Nagios主机运行事件处理程序
- Disable flap detection for this service:停止本服务抖动检测
Host Groups(主机组)
- Host:主机名称。
- Status:该主机存活状态。
- Service:显示服务检测结果。
- Actions:下面两个图标为快捷方式。
Summary (汇总)
- Host Group:主机组名称。
- Host Status Summary:该主机组存活状态。
- Service Status Summary:该主机组服务存活状态。
Grid (表格)
- Host:主机名称,可点击进入查看详细信息。
- Service:服务名称,可点击进入查看详细信息。
- Actions:下面两个图标为快捷方式。
Service Groups (服务组)
Service Groups说明同Host Groups,只是将Service Groups名称变成Host Groups而已,没有本质区别,具体说明请参考Service Groups。我们目前没将服务进行分组,所以关于服务分组的部分全部是空的。
Summary (汇总)
Service Groups Summary说明同Host Groups Summary。
Grid (表格)
Service Groups Grip说明同Host Groups Grip。
Problems (问题故障)
显示主机、服务、网络所有的故障列表
Services (Unhandled) (服务问题)
- Host:主机名称,可点击进入查看详细信息。
- Service:服务名称,可点击进入查看详细信息。
- Status:状态。
- Last Check:上次检测时间。
- Duration:运行持续时间。
- Status Information:相关状态信息。
Hosts (Unhandled) (主机问题)
- Host:主机名称,可点击进入查看详细信息。
- Status:状态。
- Last Check:上次检测时间。
- Duration:运行持续时间。
- Status Information:相关状态信息。
Network Outages (网络中断)
Network Outages 显示网络中断的信息。
Reports(报告)
Availability
Avaiability 此功能生成的报告要比Trends可供选择的种类多些,除了Trends可供选择的功能之外,还包括:对所有主机生成报告、对所有服务生成报告、对Hostgroups和Servicegroups生成报告,下图是对所有主机生成的报告:
下图是对所有服务生成的报告:
Trends
生成报告的趋势,按单个主机或服务来生成,共分为三个步骤:
1.选择主机或服务名称;
2.选择主机或者服务的具体名称;
3.选择报告选项,此选项包括报告的起始和结束时间,初使化状态等;
Alert
History
显示所有主机和服务的历史告警的信息,如下图所示:
Summary
显示相关的告警摘要的信息,可以针对主机,服务,主机群和服务群进行查询,也可以进行跨区域的查询,比如:最近24小时,最近七天,最近一个月等的查询。
Histogram
以告警直方图方式显示,其功能类似Trends选项的功能,只是直方图的方式显示相关的信息,如下图所示:
Notifications
查询当天的告警和恢复告警的信息,也可以按向左的箭头查询上一天或更早的告警信息。如下图所示:
Event Log
按每小时显示Nagios的日志信息,可以按向左的前头查询上一天或更早的信息。如下图所示:
System (系统)
comments
Downtime
本页面提供停机功能,此功能为主机和服务自定义停机时间,维护主机或者割接时常用到此功能,在指定的停机时间内,将不会发出通知;当预定的停机时间到期时,将发出通知告警。里面会有起始时间和终止时间,可以选择固定或弹性停机,此功能需重点掌握,比较常用。
Process Info
本页面提供nagios自身进程信息和管理功能,可以通过此页面停止、重启nagios进程。如下图所示:
Performance Info
本页面提供主机和服务巡检性能信息。如下图所示:
Scheduling Queue
显示所有主机和服务的检测进度队列,通过Actins关闭单个主机或服务检测。如下图所示:
Configuration
显示nagios主机、服务、监控命令、联系人、监控时段等配置信息。如下图所示:
Q&A
1、问题:无法重启
/home/nagios/var目录下objects.cache retention.dat status.dat 删除,重启进程
1、nagios map页面无法访问
查看系统中是否安装了以下的包:gd , ge-devel
l rpm -qa |grep gd
l 确保将上述模块包安装上
l 返回之前编译nagios的目录中重新编译nagios:做configure和make all
l 进入nagios/cgi/目录中查看是否有histogram.cgi跟statusmap.cgi文件,其中statusmap.cfg就是map显示必须的文件,将这两个文件cp到nagios/sbin/中
l 重启nagios,刷新nagios页面
3、Solaris5.10主机 编译nagios-plugins的snmp模块报错
check_snmp.c: In function `main':
check_snmp.c:295: error: `PATH_TO_SNMPGETNEXT' undeclared (first use in this function)
check_snmp.c:295: error: (Each undeclared identifier is reported only once
check_snmp.c:295: error: for each function it appears in.)
make[2]: *** [check_snmp.o] Error 1
make[2]: Leaving directory `/home/nagios/wangjian/nagios-plugins-2.0.3/plugins'
make[1]: *** [all-recursive] Error 1
make[1]: Leaving directory `/home/nagios/wangjian/nagios-plugins-2.0.3'
make: *** [all] Error 2
解决方法:
l 从报错信息中看出snmpgetnext无法找到路径
l 使用root帐号查找snmpgetnext路径,或者下载net-snmp安装
l Configure时指定--with-snmpgetnext-command参数路径,该参数配置snmpgetnext路径
l 重新做configure、make、make install
4、报错xinetd[2907]: FAIL: nrpe per_source_limit from=::ffff:10.11.209.173
原因:客户端xinetd对每个源ip的连接数有限制
修改方法
vi /etc/xinetd.d/nrpe
per_source = UNLIMITED
instances = UNLIMITED
service xinetd restart
Nagios页面介绍(四)的更多相关文章
- Lucene.Net 2.3.1开发介绍 —— 四、搜索(三)
原文:Lucene.Net 2.3.1开发介绍 -- 四.搜索(三) Lucene有表达式就有运算符,而运算符使用起来确实很方便,但另外一个问题来了. 代码 4.3.4.1 Analyzer anal ...
- Lucene.Net 2.3.1开发介绍 —— 四、搜索(二)
原文:Lucene.Net 2.3.1开发介绍 -- 四.搜索(二) 4.3 表达式用户搜索,只会输入一个或几个词,也可能是一句话.输入的语句是如何变成搜索条件的上一篇已经略有提及. 4.3.1 观察 ...
- Lucene.Net 2.3.1开发介绍 —— 四、搜索(一)
原文:Lucene.Net 2.3.1开发介绍 -- 四.搜索(一) 既然是内容筛选,或者说是搜索引擎,有索引,必然要有搜索.搜索虽然与索引有关,那也只是与索引后的文件有关,和索引的程序是无关的,因此 ...
- {MySQL数据库初识}一 数据库概述 二 MySQL介绍 三 MySQL的下载安装、简单应用及目录介绍 四 root用户密码设置及忘记密码的解决方案 五 修改字符集编码 六 初识sql语句
MySQL数据库初识 MySQL数据库 本节目录 一 数据库概述 二 MySQL介绍 三 MySQL的下载安装.简单应用及目录介绍 四 root用户密码设置及忘记密码的解决方案 五 修改字符集编码 六 ...
- ASP.NET Core 中的 Razor 页面介绍
标题:ASP.NET Core 中的 Razor 页面介绍 地址:https://docs.microsoft.com/zh-cn/aspnet/core/razor-pages/index?view ...
- 小程序页面的四种文件(JSON、WXML、WXSS、JS)加载顺序
一个小程序页面由四种文件组成: 1)json 页面配置文件 2)js 页面逻辑文件(必需) 3)wxml 页面结构文件(必需) 4)wxss 页面样式文件 这四个文件的加载顺序: 第一步: 加载页面j ...
- Kendo UI 单页面应用(四) Layout
Kendo UI 单页面应用(四) Layout Layout 继承自 View,可以用来包含其它的 View 或是 Layout.下面例子使用 Layout 来显示一个 View <div i ...
- 烂泥:nagios学习(四):pnp4nagios图形化绘制nagios数据
本文由秀依林枫提供友情赞助,首发于烂泥行天下 在nagios安装完毕后,我们也添加了一些监控对象,但是你会发现nagios只是简单的给我们列出那些监控对象是正常的,而没有把这些监控对象的数据进行整合. ...
- charles工具页面介绍
charles的主页面介绍 手机连上代理之后,每在手机上进行操作我们便会在charles上接收到请求.此时的charles页面将会变成如下密密麻麻的内容,故这节课我们来讲解一下Charles的主页面 ...
随机推荐
- pandas 透视表 pivot_table
The function pandas.pivot_table can be used to create spreadsheet-style pivot tables. It takes a num ...
- 基于.Net FrameWork的 RestFul Service
关于本文 这篇文章的目的就是向大家阐述如何在.net framework 4.0中创建RestFul Service并且使用它. 什么是web Services,什么是WCF 首先讲到的是web Se ...
- coreData,sqlite3,fmdb对比
core data core data 基于model-view-controller(mvc)模式下,为创建分解的cocoa应用程序提供了一个灵活和强大的数据模型框架. core data可 ...
- iOS—— static和const联合使用;使用static const 与 #define
static和const联合使用: static将一个全局变量变成局部变量 const将一个局部变量变成局部常量 // 定义了一个局部常量 static const CGFloat ...
- IText&Html2canvas js截图 绘制 导出PDF
Html2canvas JS截图 HTML <div id="divPDF"> 需要截图的区域 </div> JS <script src=" ...
- 云计算之路-阿里云上:遭遇CDN问题
7月10日11:14接到一位用户反馈,访问园子时加载不了 common.cnblogs.com/script/jquery.js 这个文件. 由于这个域名用了阿里云CDN,所以我们判断可能是某个CDN ...
- python&MongoDB爬取图书馆借阅记录(没有验证码)
题外话:这个爬虫本来是想用java完成然后发布在博客园里的,但是一直用java都失败了,最后看到别人用了python,然后自己就找别人问了问关键的知识点,发现连接那部分,python只用了19行!!! ...
- OSX 上安装 Scrapy 的那些坑
Scrapy 这个爬网框架真心不错,但在OSX上安装总是会出现各种的问题,在这里就作一个收集汇总.我的系统环境是 OS X El Capitan (10.11.1) 首先要保证 pip , virtu ...
- Unity3D 文字滚动跑马灯效果
需求 在日常游戏中,文字滚动效果是比较常用的.例如日常游戏顶部的新闻公告,聊天系统的文字滚动,都属于这个范围. 思路 由于使用的地方比较广泛,所以希望能够尽量独立的游戏之外,能够做到随处使用的功能.N ...
- 文件夹文件遍历并插入数据库的操作,IO Directory File的递归操作
在我们管理内容管理系统时,数据量大时,对机器的依赖性就比较强了,比如,我要将一个文件夹中的很多图片上传到网站,一个个上传会很花时间,就想到了通过遍历文件夹得到文件名,并将路径与文件保存到数据库中对应的 ...