分别检查服务器在Master/Slave状态下,各项服务是否正常,否则报警;

原来使用keepalived每隔1分钟调用,由于执行结果对keepalived的weight参数有影响,所以移动到外部,使用supervisord进行管理;

运行在后台,作为守护进程;

#!/bin/bash

htname=$(hostname)
vip="10.108.144.5"
epg01="10.108.144.1"
epg02="10.108.144.2"
error_number=0

function send_warn()
{
  echo "Begin to send email......"
  if [ $(ip addr | grep $epg01 | wc -l) -eq 1 ];then
  #EPG-01
    if [ -f /sunlight/python/slt_send_mail.py ];then
      if [ $(ping -w 1 -c 1 baidu.com | grep ttl | wc -l) -eq 1 ];then
        python /sunlight/python/slt_send_mail.py "$1"
      fi
    fi
  else
  #EPG-02
    ssh -p 2222 -i /usr/local/sunlight/sshkeys/init.pk -o StrictHostKeyChecking=no $epg01 "ping -w 1 -c 1 baidu.com"
    if [ $? -eq 0 ];then
      ssh -p 2222 -i /usr/local/sunlight/sshkeys/init.pk -o StrictHostKeyChecking=no $epg01 "python /sunlight/python/slt_send_mail.py \"$1\""
    fi
  fi
  echo "Send mail end......"
}

while true
do
  event_string="<p><span style='color:#FF0000'>发现运行时错误!</span></p>"
  error_number=0
  check_vip=$(ip addr | grep $vip | wc -l)
  check_cron=$(ls -l /etc/cron.d |grep "^-" | wc -l)
  check_smon=$(ps -ef | grep /usr/local/sunlight/smon | grep -v grep | wc -l)
  check_route=$(ip route | grep $vip | wc -l)
  check_ip_conflict=$(ps -ef | grep "check_server_ip_conflict.sh" | grep -v grep | wc -l)

  #master
  if [ $check_vip -eq 1 ];then
  echo "[ info ] `date "+%Y%m%d %H:%M:%S"` Server is in Master State!"
  echo "check cron......"
  echo "$check_cron"
  if [ $check_cron -lt 1 ];then
    error_number=1
    event_string="${event_string}<p>错误描述:服务器在Master状态下,/etc/cron.d/目录下定时任务文件不存在,请登录检查!</p>"
  fi
  echo "check smon......"
  echo "$check_smon"
  if [ $check_smon -ne 1 ];then
    error_number=1
    event_string="${event_string}<p>错误描述:服务器在Master状态下,smon进程不为1,请登录检查!</p>"
  fi
  echo "check route......"
  echo "$check_route"
  if [ $check_route -ne 1 ];then
    error_number=1
    event_string="${event_string}<p>错误描述:服务器在Master状态下,虚拟路由地址没有正确设置,请登录检查!</p>"
  fi
  echo "check_ip_conflict......"
  echo "$check_ip_conflict"
  if [[ $check_ip_conflict -ne 1 && $check_ip_conflict -ne 2 ]];then
    error_number=1
    event_string="${event_string}<p>错误描述:服务器在Master状态下,检测IP地址冲突的脚本没有正确运行,请登录检查!</p>"
  fi
fi

#slave
if [ $check_vip -ne 1 ];then
  echo "[ info ] `date "+%Y%m%d %H:%M:%S"` Server is in Slave State!"
  echo "check cron......"
  echo "$check_cron"
  if [ $check_cron -gt 0 ];then
    error_number=1
    event_string="${event_string}<p>错误描述:服务器在Slave状态下,/etc/cron.d/目录下定存在定时任务文件,请登录检查!</p>"
  fi

  echo "check smon......"
  echo "$check_smon"
  if [ $check_smon -ne 1 ];then
    error_number=1
    event_string="${event_string}<p>错误描述:服务器在Slave状态下,smon进程不为1,请登录检查!</p>"
  fi

  echo "check route......"
  echo "$check_route"
  if [ $check_route -eq 1 ];then
    error_number=1
    event_string="${event_string}<p>错误描述:服务器在Slave状态下,存在虚拟路由地址,请登录检查!</p>"
  fi

  echo "check_ip_conflict......"
  echo "$check_ip_conflict"
  if [[ $check_ip_conflict -ne 1 && $check_ip_conflict -ne 2 ]];then
    error_number=1
  event_string="${event_string}<p>错误描述:服务器在Slave状态下,检测IP地址冲突的脚本没有正确运行,请登录检查!</p>"
  fi
fi

event_string="${event_string}<p>消息来源:海南-三亚-亚特兰蒂斯酒店</p>"
event_string="${event_string}<p>hostname: ${htname}</p>"

if [ $error_number -eq 1 ];then
  echo $event_string
  send_warn "$event_string"
fi
sleep 60
done

检查服务器主从状态的脚本-check_server_state.sh的更多相关文章

  1. MSC服务器-主从检测脚本-check_server_state.sh

    说明: 发现keepalived会在凌晨自动进行主从切换,导致msc相关进程运行不稳定: 通过运行check_server_state.sh,及时终止/启动相关进程: 所有脚本使用supervisor ...

  2. 检查Mysql主从状态

    .检查MySQL主从同步状态 #!/bin/bash USER=bak PASSWD=123456 IO_SQL_STATUS=$(mysql -u$USER -p$PASSWD -e  show s ...

  3. 分布式项目中 linux 服务器 部署jar 应用脚本 deploy.sh

    在实际项目的部署中,尤其是分布式项目,有很多服务的jar包需要 部署,这里抽取出公用的 deploy的脚本 下面是不含jdk配置的 #!/bin/bash JAVA_OPTIONS_INITIAL=- ...

  4. 编译安装nrpe,配置监控mysql端口和主从状态

    1.安装插件 # tar xvf nagios-plugins-1.4.13.tar.gz # cd nagios-plugins-1.4.13 # ./configure # make && ...

  5. 脚本_监控 HTTP 服务器的状态

    #!bin/bash#功能:监控 HTTP 服务器的状态(测试返回码) #作者:liusingbon#设置变量,url 为你需要检测的目标网站的网址(IP 或域名)url=http://192.168 ...

  6. 监控 HTTP 服务器的状态(测试返回码)shell脚本

    #!/bin/bash # 监控 HTTP 服务器的状态(测试返回码) # 设置变量,url为你需要检测的目标网站的网址(IP 或域名),比如百度 url=http://http://183.232. ...

  7. python MySQL-Slave从服务器状态检测脚本

    #!/bin/bash mysql -e "show slave status\G" > mysql_status.txt array=($(egrep 'Slave_IO_ ...

  8. 如何编写LVS对Real Server的健康状态检测脚本

    简介:Linux 虚拟服务器(Linux Virtual Server. LVS),是一个由章文松开发的自由软件.利用KVS可以实现高可用的.可伸缩缩的Web, Mail, Cache和Medial等 ...

  9. Linux检查服务器是否被入侵

    Linux检查服务器是否被入侵 检查root用户是否被纂改 awk -F: '$3==0{print $1}' /etc/passwd awk -F: '$3==0 {print}' /etc/pas ...

随机推荐

  1. Django之REST framework源码分析

    前言: Django REST framework,是1个基于Django搭建 REST风格API的框架: 1.什么是API呢? API就是访问即可获取数据的url地址,下面是一个最简单的 Djang ...

  2. Vue 使用 vuelidate 实现表单验证

    表单验证的应用场景十分广泛,因为网站对用户输入内容的限制是非常必要的. 在vue中,我们使用vuelidate方便地实现表单验证. 官方文档在这里https://monterail.github.io ...

  3. Linux五种IO模型(同步 阻塞概念)

    Linux五种IO模型 同步和异步 这两个概念与消息的通知机制有关. 同步 所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就不返回.比如,调用readfrom系统调用时,必须等待IO操 ...

  4. kali-rolling安装nessus 7并创建扫描任务教程

    一.下载 下载页面:https://www.tenable.com/downloads/nessus 如果自己安装的kali是32位的则选择上边的32位版本下载 二.安装 直接用dpkg安装即可: d ...

  5. eclipse安装springboot插件

    1.工具栏->Help->Eclise Marketplace打开应用市场 2.在应用市场中搜索sts,选择Spring Tools 4紧张安装 3.按提示进行安装

  6. python settings :RROR 1130: Host 'XXXXXX' is not allowed to connect to this MySQL server

    pymysql.err.InternalError: (1130, u"Host '127.0.0.1' is not allowed to connect to this MySQL se ...

  7. 学习笔记-AngularJs(五)

    之前的页面太丑了,后来我引入了bootstrap.css,把样式进行修了一番,如下图(一不小心,插入个链接,忽略,http://t.cn/RUbL4rP): (链接:http://www.live08 ...

  8. 逆袭之旅DAY14.东软实训.Oracle.多表连接、分组函数、子查询

    2018-07-10 08:29:55 思考应用场景 异常数据的测试 6.显示能挣得奖金的雇员的姓名.工资.奖金,并以工资和奖金降序排列.select ename,sal,commfrom empWH ...

  9. 【转】用深度学习做crowd density estimation

    本博文主要是CVPR2016的<Single-Image Crowd Counting via Multi-Column Convolutional Neural Network>这篇文章 ...

  10. 四:FAQ附录(容器交互,镜像交互,镜像导出)

    1.交互式运行容器的方法: 1>-it进入到操作系统中: 2>另开一个cmd验证: 3>这是在image之上多了一个可写的从:可以运行centos的命令做一些事(touch .yum ...