1、 前言

如何来实现nagios监控系统的高可用,监控是很重要的,在关键时刻进行通知报警,通知人员进行相应的处理。

在进行配置的时候,需要配置两台相同服务的nagios服务器,配置相同,同时在运行,此时会存在两个问题:

Ø 在某个服务或者主机进行报警的时候,会同时发出通知,从而产生不必要的重复报警

Ø 所有的服务或者主机都会被检查两次,在网络繁忙的时候会占用生成环境的资源

要解决这两个问题,那么就必须将nagios服务器设置为主备关系,在nagios主服务发生问题的时候,nagios备服务进行接管工作,从而让nagios监控高可用

2、 基本设置

在设置nagios主备服务器的时候,必须准备两台环境相同的服务器,在其中需要安装的软件如下:

Ø Nagios核心程序

Ø Nagios插件

Ø NRPE

Ø PHP

Ø Apache

设置完成之后,两台nagios服务器均能进行发送报警通知,并且均是正常运行。

在此实验中,环境如下:

Nagios主服务器

Nagios备服务器:

3、 nagios主服务器配置

在nagios主服务器中主要要设置检查nagios服务命令

3.1 检查主服务器设置

主要来进行验证命令是否能准确的监测到nagios进程:

命令如下:

/usr/local/nagios/libexec/check_nagios -e 5 -F /usr/local/nagios/var/status.dat -C /usr/local/nagios//bin/nagios

从上面检查可以看到能够正确的监测到nagios进程

当监测不到nagios进程显示如上

3.2 配置nrpe

配置文件路径如下:

在其中添加命令如下:

command[check_nagios]=/usr/local/nagios/libexec/check_nagios -e 5 -F /usr/local/nagios/var/status.dat -C /usr/local/nagios//bin/nagios

修改其中的允许连接的主机:

3、nagios备服务器配置

4.1 测试备用服务器连接主服务器

如上所示,表示能够正确连接到nagios主服务器,并且能监测到nagios主进程服务

4.2 复制相关档案

创建目录,用来存放相关的配置:

找到编译的时候nagios的路径,如下:

将相关的配置文件拷贝到创建的目录中,如下:

4.3 修改命令配置文件

命令配置路径如下:

在其中添加的内容如下:

define command {

command_name handle-master-host-event

command_line $USER1$/eventhandlers/handle-master-host-event $HOSTSTATE$ $HOSTSTATETYPE$ $HOSTATTEMPT$

}

define command {

command_name handle-master-proc-event

command_line $USER1$/eventhandlers/handle-master-proc-event $SERVICESTATE$ $SERVICESTATETYPE$ $SERVICEATTEMPT$

}

define command {

command_name check_nrpe

command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$

}

4.4 修改本地监控配置文件

配置文件路径如下:

在其中添加的内容如下:

define host {

use                             critical-host

host_name                       nagiosMaster

alias                           nagios master

address                         192.168.1.50

event_handler                   handle-master-host-event

}

define service {

use                              critical-service

host_name                        nagiosMaster

service_description              NAGIOS

check_command                    check_nrpe!check_nagios

event_handler                    handle-master-proc-event

}

4.5 修改模板文件

主要用来增加两个模板,路径如下:

在其中增加的内容如下:

define host{

name                            critical-host

use                             generic-host

check_period                    24x7

check_interval                  5

retry_interval                  1

max_check_attempts              10

check_command                   check-host-alive

notification_period             workhours

notification_interval           120

notification_options            d,u,r

contact_groups                  admins

register                        0

}

define service{

name                            critical-service

active_checks_enabled           1

passive_checks_enabled          1                               parallelize_check               1

obsess_over_service             1

check_freshness                 0

notifications_enabled           1

event_handler_enabled           1

flap_detection_enabled          1

failure_prediction_enabled      1

process_perf_data               1

retain_status_information       1

retain_nonstatus_information    1

is_volatile                     0

check_period                    24x7

max_check_attempts              1

normal_check_interval           1

retry_check_interval            1

contact_groups                  admins

notification_options            w,u,c,r

notification_interval           60

notification_period             24x7

register                        0

}

4.6 修改nagios核心文件

路径如下:

将其中的通知进行关闭:

3、 测试

5.1 关闭监控服务器查

在nagios主机上能收到通知邮件,如下:

在nagios备机上不会收到邮箱通知,如下:

5.2 nagios服务切换

关闭nagios主机nagios服务,此时nagios备机启用服务通知:

启动nagios主机nagios服务,此时nagios备机关闭服务通知:

此时nagios主机开始发送报警通知:

6、附录事件脚本的处理内容

nagios高可用性设置的更多相关文章

  1. 怎样利用Heartbeat与Floating IP在Ubuntu 14.04上创建高可用性设置

    提供 ZStack社区 内容简单介绍 Heartbeat是一款开源程序,负责将集群基础设施容量--包括集群成员与消息收发--交付至客户server. Hearbeat在高可用性server基础设施其中 ...

  2. Nagios设置只监控不报警

    设置全部监控项都开启邮件报警: vim /usr/local/nagios/etc/nagios.cfg 设置 enable_notifications=1    1为开启,0为关闭     如个别监 ...

  3. Nagios监控平台搭建

    Nagios是一款开源的免费网络监视工具,能有效监控Windows.Linux和Unix的主机状态,交换机路由器等网络设置,打印机等.在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员, ...

  4. Nagios 安装配置

    ##Debian 6 安装server # apt-get install nagios* 一路设置好各种密码,成功后访问 http://ip/nagios3 既可,默认用户*nagiosadmin* ...

  5. ubuntu下nagios配置

    参考文献: http://www.cnblogs.com/mchina/archive/2013/02/20/2883404.html http://my.oschina.net/duangr/blo ...

  6. Nagios监控lvs服务

    1在lvs server上安装nrpe客户端: 1.1,rpm方式安装nrpe客户端 下载地址:http://download.csdn.net/detail/mchdba/7493875 [root ...

  7. Nagios安装部署

    p.MsoNormal,li.MsoNormal,div.MsoNormal { margin: 0cm; margin-bottom: .0001pt; line-height: 150%; fon ...

  8. Nagios安装、配置、问题记录

    http://youyizhimen.blog.163.com/blog/static/170917267201201745523276/ 本文描述了我在使用Nagios的过程中遇到的一些问题.解决办 ...

  9. Nagios监控

    1.Nagios监控软件 Nagios是一款开源的免费网络监视工具,能有效监控Windows.Linux和Unix的主机状态,交换机路由器等网络设置,打印机等.在系统或服务状态异常时发出邮件或短信报警 ...

随机推荐

  1. wrong number of arguments,java方法反射时数组参数的坑

    java方法中只有一个参数是数组,反射的时候我们不能想当然的传歌数组进去,传数组进去的时候表示多个参数. 两个数组不是一个意思啊. 我们应该把数组转为objet,这样才表示一个参数. import j ...

  2. 解决 ko mapping 数组无法添加新对象的问题

    这两天页面模板化的进程有些放缓,使用 ko mapping 插件的情形多了起来.组员经常问到的问题即是往 ko mapping 数组添加新对象时,报找不到方法的错误:而使用 ko.observable ...

  3. 使用ExtJs实现文件下载

    文件下载,是不可以直接通过Ext.Ajax.Request来实现的.一般的,可以通过创建一个隐藏的form表单来实现.具体代码以及代码注释如下: if (!Ext.fly('downForm')){ ...

  4. POJ -3190 Stall Reservations (贪心+优先队列)

    http://poj.org/problem?id=3190 有n头挑剔的奶牛,只会在一个精确时间挤奶,而一头奶牛需要占用一个畜栏,并且不会和其他奶牛分享,每头奶牛都会有一个开始时间和结束时间,问至少 ...

  5. TCSRM5961000

    一直没想到怎么去重 看了眼别人的代码...so easy啊 同余啊 唉..脑子被僵尸吃掉了 难得1000出个简单的 #include <iostream> #include<cstd ...

  6. 4 张 GIF 图帮助你理解二叉查找树

    二叉查找树(Binary Search Tree),也称二叉搜索树,是指一棵空树或者具有下列性质的二叉树: 1.任意节点的左子树不空,则左子树上所有结点的值均小于它的根结点的值: 2.任意节点的右子树 ...

  7. Python3 学习第九弹: 模块学习二之文件管理模块

    os模块 提供访问操作系统的接口 1> name 获得当前操作系统 其中 'nt' 是 windows 'posix' 是 linux 2> environ 获得当前系统的环境变量的字典, ...

  8. CSS 中浮动的使用

    float none 正常显示 left 左浮动 right 右浮动 clear none 允许两边浮动 left 不允许左边浮动 right 不允许右边浮动 both 不允许两边浮动 <!DO ...

  9. Winform——计算器进制转换

    namespace 进制转换2._0 { public partial class Form1 : Form { public Form1() { InitializeComponent(); } p ...

  10. Winform——计算器

    namespace 计算器2._0 { public partial class Form1 : Form { public Form1() { InitializeComponent(); } pr ...