CentOS下搭建Nagios

王尚
2014.11.09
操作系统:CentOS-6.5-i386-bin-DVD1.iso

安装在VM中进行测试的。
本章需要的软件链接:

php-5.3.2.tar.gz

http://www.163disk.com/fileview_2161669.html

nagios-plugins-1.4.14.tar.gz

http://www.163disk.com/fileview_2161667.html

nagios-cn-3.2.3.tar.bz2

http://www.163disk.com/fileview_2161666.html

nagios-3.2.0.tar.gz

http://www.163disk.com/fileview_2161665.html

httpd-2.0.63.tar.gz

http://www.163disk.com/fileview_2161664.html

本期文章按照《高性能Linux服务器构建实战:运维监控、性能调优与集群应用》进行实验的,其中针对本人的操作故总结以后发表出来,如有雷同请谅解,这里仅仅作为学习交流之用。该教程链接http://www.163disk.com/fileview_2161673.html

1、介绍nagios

Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

1) 
监控网络服务(SMTP、POP3、HTTP、NNTP、PING等);

2) 
监控主机资源(处理器负荷、磁盘利用率等);

3) 
简单地插件设计使得用户可以方便地扩展自己服务的检测方法;

4) 
并行服务检查机制;

5) 
具备定义网络分层结构的能力,用"parent"主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态;

6) 
当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式);

7) 
可以定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用;

8) 
自动的日志滚动功能;

9) 
可以支持并实现对主机的冗余监控;

10) 
可选的WEB界面用于查看当前的网络状态、通知和故障历史、日志文件等;

2、nagios的安装和配置

1) 安装nagios

(1)创建nagios用户和用户组,将nagios的主程序目录设置为nagios。

(2)
在nagios的监控服务器上开启sendmail服务,目的是让nagios在检测到故障时可以发送报警邮件。

(3)
编译安装nagios

(4)
设置nagios开机自启

nagios的安装目录下的结构

(5)安装nagios插件

nagios只提供少数的监控功能,它是通过相应的插件来实现其其它强大的功能。这里选用nagios-plugins-1.4.14版本。

注意:插件的安装必须和nagios安装的路径一致。安装完的插件会在nagios主程序目录/usr/local/nagios/libexec目录下产生可执行文件。

(6)安装nagios汉化插件(需要安装相应的类库才能完成,具体操作看本期文章结尾的备注1)

(7)安装与配置Apache

nagios提供Web监控界面,通过Web监控界面可以看到监控的主机和资源的运行状态。可以安装apache、nginx,这里选择apache。

(nagios3.1.x版本后,配置监控界面需要php的支持。)

安装apache

安装php(需要安装相应的类库才能完成,具体操作看本期文章结尾的备注2)

配置apache

修改/usr/local/apache2/conf/httpd.conf的apache的进程启动用户为nagios

修改为:

找到:

修改为并且增加如下内容:

为了安全,访问的nagios的web监控界面需要授权才能访问。在httpd.conf文件的最后添加如下信息:

(8)创建apache目录验证文件

在上面的配置中,指定了目录验证文件htpasswd,下面创建这样一个文件:

这样就在/usr/local/nagios/etc目录下创建了一个httpasswd的验证文件,对应的用户名为ixdba。

(9)启动apache服务

成功启动apache后,可以看到nagios的默认web监控界面。如果安装的是nagios的中文包,可以看到中文界面。

2) 配置nagios

nagios主要监控一台或者多台本地主机及远程主机的各种信息。默认的nagios配置没有任何监控内容,仅是一些模板文件。下面是/usr/local/nagios/etc目录下的一些配置文件:

nagios的默认配置文件并不是必需的,可以使用这些默认的配置文件,也可以创建自己的配置文件,然后在主配置文件nagios。cfg中引用。

nagios配置涉及的几个定义:主机、主机组、服务、服务组、联系人、联系人组、监控时间、监控命令。必需明白:第一步定义监控哪些主机、主机组、服务、服务组;第二定义监控要通过什么命令实现;第三定义监控的时间段;第四定义主机或服务出现问题时要通知的联系人和联系人组。

创建hosts.cfg文件定义主机和主机组。

创建services.cfg文件定义服务。

使用默认的contacts.cfg文件定义联系人和联系人组。

使用默认的commands.cfg文件定义命令。

使用默认的timeperiods.cfg文件定义监控时间段。

使用默认的templates.cfg文件作为资源引用文件。

templates.cfg是一个模板配置文件,将一些共性的属性定义成模板,以便多次引用。

resource.cfg文件是nagios的变量定义文件。

变量$USER1$指定了安装nagios插件的路径。如果把插件安装在其他路径,只需在此修改。

commands.cfg文件

hosts.cfg文件

此文件需要创建。hosts.cfg主要用来指定被监控的主机地址及相关属性信息。按以下配置:(创建了两个远程主机和一个主机组)

services.cfg文件需要自己动手创建,该文件主要用于定义监控的服务和主机资源。按以下进行配置:

在这里分别对web和mysql的主机设置了4个监控服务,分别是check_ping、check_ssh、check_ftp、check_http。在services.cfg文件中有很多对命令的定义。这些命令均在commands.cfg中进行定义。其实这些命令就是安装nagios插件后生成的可执行文件。

contacts.cfg文件是一个定义联系人和联系人组的配置文件,当监控的主机或者服务出现故障时,nagios会通过指定的通知方式将信息发给指定的联系人和联系人组。按以下进行配置:

timeperiods.cfg此文件定义监控的时间段。按如下配置:

cgi.cfg此文件定义控制相关的CGI脚本。如果想在nagios的web监控界面执行CGI脚本,例如:重启nagios进程、关闭nagios通知、停止nagios主机检测,就需要配置cgi.cfg文件了。由于nagios的web监控界面验证用户为ixdba,因此需要在cgi.cfg文件添加此用户的执行权限就可以了。按如下修改:

把新建的那几个文件放到/usr/local/nagios/etc/下,其他默认的放在原来位置即可。在nagios.cfg中调用相应的路径即可。

nagios.cfg该文件是nagios的核心文件,所有的对象配置文件都必须在这个文件中定义才能发挥作用,这里只要引用对象配置文件即可。以下是nagios.cfg文件的介绍:

(以上的引用路径有点变动,需要自己把自己的路径写进去)

3) 验证第二步的配置文件的正确性

使用上述的命令,可以很快的定位错误根源。

4) 启动和停止nagios

(初始化脚本启动nagios)/etc/init.d/nagios start或service nagios start

(手工方式启动nagios)/usr/local/nagios/bin/nagios -d /usr/local/nagios/etc/nagios.cfg

(初始化脚本关闭nagios)/etc/init.d/nagios stop或service nagios stop

(通过Kill方式关闭nagios)kill
(ps -ef|grep nagios)

(初始化脚本来重启nagios)/etc/rc.d/init.d/nagios reload或restart

通过web监控页面重启nagios(在进程里面)

手工方式平滑重启kill -HUP
pid

5) nagios使用邮件进行故障报警

nagios的故障报警功能很强大,可以支持邮件、短信、MSN、qq等多种方式。在这里面邮件报警最简单,只需添加报警的邮件地址即可;短信报警需要硬件或第三方插件支持,例如飞信;MSN和QQ报警需要编写自己的自定义的脚本。下图是邮件报警:

注:欢迎大家提出问题。。。

CentOS服务器运维监控Nagios(一)的更多相关文章

  1. 建设DevOps统一运维监控平台,全面的系统监控 Zabbix VS Nagios VS Open-Falcon OR Prometheus

    前言 随着Devops.云计算.微服务.容器等理念的逐步落地和大力发展,机器越来越多,应用越来越多,服务越来越微,应用运行基础环境越来多样化,容器.虚拟机.物理机不一而足.面对动辄几百上千个虚拟机.容 ...

  2. 优化系统资源ulimit《高性能Linux服务器构建实战:运维监控、性能调优与集群应用》

    优化系统资源ulimit<高性能Linux服务器构建实战:运维监控.性能调优与集群应用> 假设有这样一种情况,一台Linux 主机上同时登录了10个用户,在没有限制系统资源的情况下,这10 ...

  3. 优化Linux内核参数/etc/sysctl.conf sysctl 《高性能Linux服务器构建实战:运维监控、性能调优与集群应用》

    优化Linux内核参数/etc/sysctl.conf  sysctl  <高性能Linux服务器构建实战:运维监控.性能调优与集群应用> http://book.51cto.com/ar ...

  4. 线上Linux服务器运维安全策略经验分享

    线上Linux服务器运维安全策略经验分享 https://mp.weixin.qq.com/s?__biz=MjM5NTU2MTQwNA==&mid=402022683&idx=1&a ...

  5. 运维监控-使用Zabbix Server 添加自定义 item

    运维监控-使用Zabbix Server 监控自定义 item  作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客就直接开门见山如何使用Zabbix Server 监控自定义 ...

  6. 运维监控-基于yum的方式部署Zabbix Server 4.0 版本

    运维监控-基于yum的方式部署Zabbix Server 4.0 版本 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.如何选择zabbix版本 1>.打开zabbix官方 ...

  7. Linux服务器运维安全策略经验分享

    http://jxtm.jzu.cn/?p=3692 大家好,我是南非蚂蚁,今天跟大家分享的主题是:线上Linux服务器运维安全策略经验.安全是IT行业一个老生常谈的话题了,从之前的“棱镜门”事件中折 ...

  8. 【微学堂】线上Linux服务器运维安全策略经验分享

      技术转载:https://mp.weixin.qq.com/s?__biz=MjM5NTU2MTQwNA==&mid=402022683&idx=1&sn=6d403ab4 ...

  9. 谈谈我的windows服务器运维管理

    我们开发的页游General War(http://gw.gamebox.com)上线运营也有半年多了,服务器的开发到运维基本都由我一手包办,在服务器上线之后我们又招了一个程序员接手后续功能的开发,而 ...

随机推荐

  1. phpcms V9 后台验证码图片不显示

    某个网站在本地运行成功,上传到服务器上后,发现后台登陆的验证码图片不显示 根据网上提供的解决方案, 网站路径变量web_path没问题 database.system的配置路径没问题 apache的G ...

  2. 简单轻量级的一套JS 类库(RapidDevelopmentFramework.JS)

    1.最近好久没有更新自己的博客了,一直在考虑自己应该写一些什么.4.2日从苏州回到南京的路上感觉自己的内心些崩溃和失落,我就不多说了? 猛然之间我认为自己需要找一下内心的平衡.决定开发属于自己一套快速 ...

  3. Python爬虫从入门到放弃(十)之 关于深度优先和广度优先

    网站的树结构 深度优先算法和实现 广度优先算法和实现 网站的树结构 通过伯乐在线网站为例子: 并且我们通过访问伯乐在线也是可以发现,我们从任何一个子页面其实都是可以返回到首页,所以当我们爬取页面的数据 ...

  4. SSH工作原理图

    一个请求在Struts2框架中的处理大概分为以下几个步骤 : 1 客户端初始化一个指向Servlet容器(例如Tomcat)的请求 2 这个请求经过一系列的过滤器(Filter)(这些过滤器中有一个叫 ...

  5. 【LeetCode】191. Number of 1 Bits

    题目: Write a function that takes an unsigned integer and returns the number of ’1' bits it has (also ...

  6. 【Android Developers Training】 104. 接受地点更新

    注:本文翻译自Google官方的Android Developers Training文档,译者技术一般,由于喜爱安卓而产生了翻译的念头,纯属个人兴趣爱好. 原文链接:http://developer ...

  7. 精通 JS正则表达式(转)

    转载的目的在于:增加一些自己看不懂的解释.内容只加不改,灰色字体是自己寻找并增加的. 正则表达式可以: •测试字符串的某个模式.例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式 ...

  8. 把对象列表转化成json数据格式

    package JsonTest; import java.util.ArrayList; import java.util.List; public class test { public stat ...

  9. 我的学习之路_第二十八章_JQuery 和validator插件

    jQuery 利用jQuery进行遍历 js原生: for(var i=0;i>?;i++){ } jQuery: 方式一: 想要遍历的jQuery对象.each(function(index, ...

  10. voa 2015 / 4 / 19

      potentially – adv. capable of becoming real, a possibility tackle – v. to deal with a difficult pr ...