1.一定要找应用侧确认每台节点上需要监控的进程,不要盲目以为所有hadoop集群的zk、journal啥的都一样,切记!

2.被监控节点只需要安装nagios-plugin和nrpe,依赖需要安装xinetd

3.确认被监控节点上没有安装过nagios

4.确认被监控节点间、被监控节点和nagios server间的互信

5.开始

5-1 选择一个同操作系统的集群a的一个节点an,目标集群b

ssh an

for dn in cluster{an..b1}

do

echo "$dn is configuring the nagios............................."

ssh $dn useradd nagios -d /usr/local/nagios

scp -r /usr/local/nagios/ root@$dn:/usr/local/

scp /etc/xinetd.d/nrpe  root@$dn:/etc/xinetd.d/nrpe

ssh $dn 'echo "nrpe            5666/tcp                #nrpe" >>/etc/services'

ssh $dn 'chown -R nagios:nagios /usr/local/nagios/'

ssh $dn 'service xinetd restart'

echo "$dn is end configuring  the nagios........................"

done

5-2 在集群b上批量安装

ssh b1

for dn in cluster{b2..bn}

do

echo "$dn is configuring the nagios............................."

ssh $dn useradd nagios -d /usr/local/nagios

scp -r /usr/local/nagios/ root@$dn:/usr/local/

scp /etc/xinetd.d/nrpe  root@$dn:/etc/xinetd.d/nrpe

ssh $dn 'echo "nrpe            5666/tcp                #nrpe" >>/etc/services'

ssh $dn 'chown -R nagios:nagios /usr/local/nagios/'

ssh $dn 'service xinetd restart'

echo "$dn is end configuring  the nagios........................"

done

5-3 如果配置了logcheck /var/log/messages,一定要确认下/var/log/messages的权限是不是705

5-4 在server端增加新集群的配置文件

mkdir -p /usr/local/nagios/etc/servers/b

cd /usr/local/nagios/etc/servers/a

cat an.cfg|sed 's/an/bn/g'|sed 's/an_ip/bn_ip/g'>/usr/local/nagios/etc/servers/b/bn.cfg

5-5 在server端增加新集群的组配置文件

vi /usr/local/nagios/etc/servers/group.cfg

define hostgroup{

hostgroup_name b

alias b

members b1,....bn

}

6.集群下线

这次只是在nagios前台下线,下线集群保留nagios软件,升级后再重新监控

只需要在server端把该集群的所有配置删掉(移走)即可

注:不要想着修改权限。。。。。修改权限的结果就是nagios起不起来。。。

nagios新增监控集群、卸载监控集群批量操作的更多相关文章

  1. 如何用Prometheus监控十万container的Kubernetes集群

    概述 不久前,我们在文章<如何扩展单个Prometheus实现近万Kubernetes集群监控?>中详细介绍了TKE团队大规模Kubernetes联邦监控系统Kvass的演进过程,其中介绍 ...

  2. Hystrix集群及监控turbine

    Hystrix集群及监控turbine 前面Dashboard演示的仅仅是单机服务监控,实际项目基本都是集群,所以这里集群监控用的是turbine. turbine是基于Dashboard的. 先搞个 ...

  3. cAdvisor0.24.1+InfluxDB0.13+Grafana4.0.2搭建Docker1.12.3 Swarm集群性能监控平台

    目录 [TOC] 1.基本概念 ​ 既然是对Docker的容器进行监控,我们就不自己单独搭建cAdvisor.InfluxDB.Grarana了,本文中这三个实例,主要以Docker容器方式运行. 本 ...

  4. Spring Cloud Turbine微服务集群实时监控

    本文代码下载地址: https://gitlab.com/mySpringCloud/turbine SpringBoot版本:1.5.9.RELEASE (稳定版) SpringCloud版本:Ed ...

  5. Hadoop记录-Hadoop集群重要监控指标

    通用监控指标 对于每个RPC服务应该监控 RpcProcessingTimeAvgTime(PRC处理的平均时间) 通常hdfs在异常任务突发大量访问时,这个参数会突然变得很大,导致其他用户访问hdf ...

  6. Kubernetes集群的监控报警策略最佳实践

    版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/M2l0ZgSsVc7r69eFdTj/article/details/79652064 本文为Kub ...

  7. 高可用Kubernetes集群-14. 部署Kubernetes集群性能监控平台

    参考文档: Github介绍:https://github.com/kubernetes/heapster Github yaml文件: https://github.com/kubernetes/h ...

  8. kafka集群及监控部署

    1. kafka的定义 kafka是一个分布式消息系统,由linkedin使用scala编写,用作LinkedIn的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础 ...

  9. Prometheus 监控K8S集群资源监控

    Prometheus 监控K8S集群中Pod 目前cAdvisor集成到了kubelet组件内,可以在kubernetes集群中每个启动了kubelet的节点使用cAdvisor提供的metrics接 ...

  10. (转)实验文档4:kubernetes集群的监控和日志分析

    改造dubbo-demo-web项目为Tomcat启动项目 Tomcat官网 准备Tomcat的镜像底包 准备tomcat二进制包 运维主机HDSS7-200.host.com上:Tomcat8下载链 ...

随机推荐

  1. 启动Tomcat任何程序都报错

    启动Tomcat出现: Cannot publish to the server because it is missing its runtime environment. 可能是servers中不 ...

  2. code+3月赛 loj6299 白金元首与克劳德斯

    千里白金雪满天 烽火江山起狼烟 分手竟兵刃相见 1941.7. 苏联军队出乎意料的反抗力量.前线德军的补给困难 —— 元首 Adolf 望着天空的云层陷入沉思…… 在 xyxyxy-直角坐标平面的天空 ...

  3. NOI2015 软件包管理器(树链剖分+线段树)

    P2146 软件包管理器 题目描述 Linux用户和OSX用户一定对软件包管理器不会陌生.通过软件包管理器,你可以通过一行命令安装某一个软件包,然后软件包管理器会帮助你从软件源下载软件包,同时自动解决 ...

  4. 9.11NOIP模拟题

    NOIP模拟赛 by thmyl   题目名称 superman market Lemon_Soda 可执行文件名 superman market Lemon_Soda 输入文件 superman.i ...

  5. Flask小总结+实例化Flask参数以及对app的配置

    Flask 小而精 三方组件全 稳定性相对较差 1.启动: from flask import Flask app = Flask(__name__) app.run("0.0.0.0&qu ...

  6. HDU 5306 吉司机线段树

    思路: 后面nlogn的部分是伪证... 大家可以构造数据证明是这是nlog^2n的啊~ 吉老司机翻车了 //By SiriusRen #include <cstdio> #include ...

  7. 【BZOJ4566_洛谷3181】[HAOI2016]找相同字符(SAM)

    自己yy的方法yyyyyyyy着就A了,写篇博客庆祝一下. 题目: 洛谷3181 分析: SAM(可能是)模板题(不会SAM的同学戳我:[知识总结]后缀自动机的构建). 对\(s1\)建出SAM,用\ ...

  8. jQuery五屏轮播手风琴切换代码

    jQuery五屏轮播手风琴切换代码 在线演示本地下载

  9. Skeleton Screen — 骨架屏

    用户体验一直是前端开发需要考虑的重要部分,在数据请求时常见到锁屏的loading动画,而现在越来越多的产品倾向于使用Skeleton Screen Loading(骨架屏)替代,以优化用户体验. Sk ...

  10. 实现微信小程序的wxml文件和wxss文件在phpstrom的支持

    最近下载了微信小程序准备好好看看,但是发现微信小程序用的后缀名是不一样的,.wxml代表的就是平时用的.html,.wxss代码的就是平时用的.css.但是phpstorm无法识别,为了更方便的码代码 ...