1、编写python脚本监控nginx

#!/usr/bin/python
# -*- coding: utf-8 -*-
import os, sys, time
import string
import getopt
def usage():
print """check_nginx is a Nagios to monitor nginx status
Usage: check_nginx [-h|--help][-w|--warning][-c|--critical] Options:
--help|-h)
print check_nginx help.
--warning|-w)
Sets a warning level for nginx Active connections. Default is: off
--critical|-c)
Sets a critical level for nginx Active connections. Default is: off
Example:
./check_nginx -w 10 -c 5""" sys.exit(3)
try:
options,args = getopt.getopt(sys.argv[1:],"hw:c:",["help","warning=","critical="])
#“hw:c:”短格式 --- h 后面没有冒号:表示后面不带参数,p:和 i:后面有冒号表示后面需要参数
#["help","warning=","critical="]长格式 --- help后面没有等号=,表示后面不带参数,其他三个有=,表示后面需要参数
#返回值 options 是个包含元祖的列表,每个元祖是分析出来的格式信息,比如 [('-i','127.0.0.1'),('-p','80')] ;
#args 是个列表,包含那些没有‘-’或‘--’的参数,比如:['55','66']
except getopt.GetoptError:
usage()
sys.exit(3)
for name,value in options:
if name in ("-h","--help"):
usage()
if name in ("-w","--warning"):
warning = int(value)
if name in ("-c","--critical"):
critical = int(value)
try:
ret = os.popen('ps -C nginx -o pid,cmd').readlines()
except Exception:
print "NGINX STATUS unknown: Error while getting Connection"
sys.exit(3)
if len(ret) < critical:
print "Critical-nginx process is killed."
sys.exit(2)
elif len(ret) < warning:
print "Warning-nginx process is too low."
sys.exit(1)
else:
print "OK-nginx is running"
sys.exit(0)

2、将脚本check_nginx拷贝到/usr/local/nagios/libexec/下,并chmod +x ./check_nginx

如果你要监控nagios安装本机的nginx进程,请参考如下步骤:

3、在/usr/local/nagios/etc/command中增加如下

  define command{
        command_name    check_nginx
        command_line    $USER1$/check_nginx -w $ARG1$ -c $ARG2$
        }

4、在自己定义的service.cfg中增加

  define service{
        use                     generic-service
        host_name               localhost
        service_description     nginx
        check_command           check_nginx!4!2
        max_check_attempts      5
        normal_check_interval   3
        retry_check_interval    2
        check_period            24x7
        notification_interval   10
        notification_period     24x7
        notification_options    w,u,c,r
        contact_groups          admins
        }

如果需要监控远程主机的nginx进程,请先安装nrpe,然后参考如下

3、Vim /etc/nagios/nrpe.cfg

  加入一行

  command[check_nginx]=/usr/local/nagios/libexec/check_nginx -w $ARG1$ -c $ARG2$

4、修改/etc/nagios/nrpe.cfg

  dont_blame_nrpe=1 #打开参数传递

5、重启nrpe

  /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d

  测试执行

  /usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 -c check_nginx -a 4 1

  如果能够正常返回值就是正常的

6、在/usr/local/nagios/etc/object/command中增加

define command{
        command_name
check_nrpe
        command_line /usr/local/nagios/libexec/check_nrpe –H
$HOSTADDRESS$ -c $ARG1$ -a $ARG2$ $ARG3$
        }

7、在自己定义的service.cfg中增加

define service{
        use                     generic-service
        host_name               localhost
        service_description     nginx
        check_command           check_nrpe!check_nginx!4!2
        max_check_attempts      5
        normal_check_interval   3
        retry_check_interval    2
        check_period            24x7
        notification_interval   10
        notification_period     24x7
        notification_options    w,u,c,r
        contact_groups          admins
        }

使用nagios+python监控nginx进程数的更多相关文章

  1. shell习题第13题:监控nginx进程

    [题目要求] 在服务器上写一个脚本,要求如下 1. 每隔10秒去检查而一次服务器上的nginx进程数,如果>=500的时候,就需要自动重启一下nginx服务,并检测启动是否成功 2. 如没有正常 ...

  2. Python 监控nginx服务是否正常

    Python 监控nginx服务是否正常 #!/usr/bin/env python import os, sys, time from time import strftime while True ...

  3. zabbix监控nginx进程

    确认nginx有没有安装模块 然后在主站点下添加(二级站点) location /NginxStatus { stub_status on; access_log off; allow 127.0.0 ...

  4. 阿里云自定义监控tomcat进程数

    阿里云提供自定义监控SDK,这有助于我们定制化的根据自身业务来做监控,下面我就根据业务需求来介绍一个简单的自定义监控配置. 阿里提供了2个版本的自定义监控接口:自定义监控SDK(python版) :c ...

  5. nginx-rrd监控nginx访问数

    一 .查看已安装的nginx是否包含stub_status模块 /usr/local/nginx/sbin/nginx -V nginx version: Nginx/1.2.0 configure ...

  6. Nagios监控nginx服务具体过程

    1在nginx 服务器上安装nrpe客户端: Nginx的服务须要监控起来.不然万一down了而不及时修复,会影响web应用.例如以下web应用上面启动的nginx后台进程[root@lb-net-2 ...

  7. ubuntu下修改nginx的进程数

    1. 进入nginx配置文件:vim /etc/nginx/nginx.conf2. 将events下的worker_processes 修改为 你希望的数字,保存文件并退出3. 重启nginx: s ...

  8. zabbix监控Nginx模板

    前提条件: nginx模块安装了http_stub_status_module和nginx_upstream_check_module: 在nginx的配置文件中配置上: location /stat ...

  9. 让keepalived监控NginX的状态

    经过前面的配置,如果主服务器的keepalived停止服务,从服务器会自动接管VIP对外服务:一旦主服务器的keepalived恢复,会重新接管VIP. 但这并不是我们需要的,我们需要的是当NginX ...

随机推荐

  1. isdigit()

    isdigit() 是字符串的一个方法,用来判断这个字符串是否是纯数字的字符串 In [1]: str = 'hello' In [2]: str.isdigit() Out[2]: False In ...

  2. hasattr() 、getattr() 、setattr()

    hasattr(object, name) :用于判断一个对象中是否有指定的属性或方法,如果存在返回 True,否则返回 False getattr(object, name, [default]) ...

  3. Unity随机Prefab,自动前往某点处理

    对与U3D  AI,看了下,自己做了小功能,以备后用啊! 一,在某区域随机产生某个对象 C# 文件名称为RadomAPoint.cs using UnityEngine; using System.C ...

  4. CMS3.0——初次邂逅express

    前言: 刚接手cms3.0的工作,似乎对一切都那么的不熟悉,于是在开始新需求之前,先做一个简单的登录系统. 项目目录: 1.使用webstroms建expreess项目,非常方便简单,建好的项目目录就 ...

  5. eclipse启动错误

    1.错误日志 !SESSION 2013-12-09 12:24:33.826 -----------------------------------------------eclipse.build ...

  6. flask框架实战项目架构

    一.项目架构: 研习了多天flask,今天终于按照标准流程写了一个实验demo,并实现了ORM调用,一起喜欢自己写原生SQL.废话不多说,来看项目文件结构 mysite/ ./config/ defa ...

  7. 代码片段,lucene基本操作(基于lucene4.10.2)

    1.最基本的创建索引: @Test public void testIndex(){ try { Directory directory = FSDirectory.open(new File(LUC ...

  8. nutch 1.7导入Eclipse

    1.下载Nutch1.7的包 apache-nutch-1.7-src.zip,解压之后应该包括 bin,conf,src等目录 2.将解压之后的 apache-nutch-1.7 文件夹放到ecli ...

  9. mysql数据库LOAD DATA INFILE Syntax

    1.LOAD DATA INFILE用来把一个文本文件里的内容高速写入到MySQL表里,它和SELECT ... INTO FILE的操作是对应的,一个导入.一个导出.使用LOAD DATA INFI ...

  10. vue-cli 项目打包异常汇总

    1.打包路径错误 npm run build 之后,会发现项目目录下多了 通过 localhost 运行 index.html 会发现空白,仔细一看,是因为引用的资源位置问题 明显这个地方应该是 ./ ...