nagios新增监控集群、卸载监控集群批量操作
1.一定要找应用侧确认每台节点上需要监控的进程,不要盲目以为所有hadoop集群的zk、journal啥的都一样,切记!
2.被监控节点只需要安装nagios-plugin和nrpe,依赖需要安装xinetd
3.确认被监控节点上没有安装过nagios
4.确认被监控节点间、被监控节点和nagios server间的互信
5.开始
5-1 选择一个同操作系统的集群a的一个节点an,目标集群b
ssh an
for dn in cluster{an..b1}
do
echo "$dn is configuring the nagios............................."
ssh $dn useradd nagios -d /usr/local/nagios
scp -r /usr/local/nagios/ root@$dn:/usr/local/
scp /etc/xinetd.d/nrpe root@$dn:/etc/xinetd.d/nrpe
ssh $dn 'echo "nrpe 5666/tcp #nrpe" >>/etc/services'
ssh $dn 'chown -R nagios:nagios /usr/local/nagios/'
ssh $dn 'service xinetd restart'
echo "$dn is end configuring the nagios........................"
done
5-2 在集群b上批量安装
ssh b1
for dn in cluster{b2..bn}
do
echo "$dn is configuring the nagios............................."
ssh $dn useradd nagios -d /usr/local/nagios
scp -r /usr/local/nagios/ root@$dn:/usr/local/
scp /etc/xinetd.d/nrpe root@$dn:/etc/xinetd.d/nrpe
ssh $dn 'echo "nrpe 5666/tcp #nrpe" >>/etc/services'
ssh $dn 'chown -R nagios:nagios /usr/local/nagios/'
ssh $dn 'service xinetd restart'
echo "$dn is end configuring the nagios........................"
done
5-3 如果配置了logcheck /var/log/messages,一定要确认下/var/log/messages的权限是不是705
5-4 在server端增加新集群的配置文件
mkdir -p /usr/local/nagios/etc/servers/b
cd /usr/local/nagios/etc/servers/a
cat an.cfg|sed 's/an/bn/g'|sed 's/an_ip/bn_ip/g'>/usr/local/nagios/etc/servers/b/bn.cfg
5-5 在server端增加新集群的组配置文件
vi /usr/local/nagios/etc/servers/group.cfg
define hostgroup{
hostgroup_name b
alias b
members b1,....bn
}
6.集群下线
这次只是在nagios前台下线,下线集群保留nagios软件,升级后再重新监控
只需要在server端把该集群的所有配置删掉(移走)即可
注:不要想着修改权限。。。。。修改权限的结果就是nagios起不起来。。。
nagios新增监控集群、卸载监控集群批量操作的更多相关文章
- 如何用Prometheus监控十万container的Kubernetes集群
概述 不久前,我们在文章<如何扩展单个Prometheus实现近万Kubernetes集群监控?>中详细介绍了TKE团队大规模Kubernetes联邦监控系统Kvass的演进过程,其中介绍 ...
- Hystrix集群及监控turbine
Hystrix集群及监控turbine 前面Dashboard演示的仅仅是单机服务监控,实际项目基本都是集群,所以这里集群监控用的是turbine. turbine是基于Dashboard的. 先搞个 ...
- cAdvisor0.24.1+InfluxDB0.13+Grafana4.0.2搭建Docker1.12.3 Swarm集群性能监控平台
目录 [TOC] 1.基本概念 既然是对Docker的容器进行监控,我们就不自己单独搭建cAdvisor.InfluxDB.Grarana了,本文中这三个实例,主要以Docker容器方式运行. 本 ...
- Spring Cloud Turbine微服务集群实时监控
本文代码下载地址: https://gitlab.com/mySpringCloud/turbine SpringBoot版本:1.5.9.RELEASE (稳定版) SpringCloud版本:Ed ...
- Hadoop记录-Hadoop集群重要监控指标
通用监控指标 对于每个RPC服务应该监控 RpcProcessingTimeAvgTime(PRC处理的平均时间) 通常hdfs在异常任务突发大量访问时,这个参数会突然变得很大,导致其他用户访问hdf ...
- Kubernetes集群的监控报警策略最佳实践
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/M2l0ZgSsVc7r69eFdTj/article/details/79652064 本文为Kub ...
- 高可用Kubernetes集群-14. 部署Kubernetes集群性能监控平台
参考文档: Github介绍:https://github.com/kubernetes/heapster Github yaml文件: https://github.com/kubernetes/h ...
- kafka集群及监控部署
1. kafka的定义 kafka是一个分布式消息系统,由linkedin使用scala编写,用作LinkedIn的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础 ...
- Prometheus 监控K8S集群资源监控
Prometheus 监控K8S集群中Pod 目前cAdvisor集成到了kubelet组件内,可以在kubernetes集群中每个启动了kubelet的节点使用cAdvisor提供的metrics接 ...
- (转)实验文档4:kubernetes集群的监控和日志分析
改造dubbo-demo-web项目为Tomcat启动项目 Tomcat官网 准备Tomcat的镜像底包 准备tomcat二进制包 运维主机HDSS7-200.host.com上:Tomcat8下载链 ...
随机推荐
- unsigned 赋值负数输出情况 & printf输出格式
%d 有符号10进制整数 %ld 长整型 %hd短整型 %i 有符号10进制整数 %o 无符号8进制整数 %u 无符号10进制整数 %x 无符号的16进制数字,并以小写abcdef表示 %X 无符号的 ...
- Word中公式和文字混排对齐的问题
全选-字体-字符间距-位置-标准-确定 段落-中文版式-文本对齐方式-居中-确定
- word文档在线预览解决方案
花了一整天在网上翻关于 “word文档在线预览解决方案” 相关的资料,感觉实现难度比较大还是用PDF来解决好了.. 下面列一下比较好的参考资料吧 参考资料 前端实现在线预览pdf.word.xls.p ...
- 最全的C/C++入门到进阶的书籍推荐,你需要嘛?
编程是操作性很强的一门知识,看书少不了,但只有学习和实践相结合才能起到很好的效果,一种学习方法是看视频->看书->研究书中例子->自己做些东西->交流->看书. 研究经典 ...
- Java学习-异常2
1.异常处理的第一种方式是:上抛[throws] 2.异常处理的第二种方式是:try....catch..如果不想让调用程序知道该异常发生了,被调用的程序应该使用try...catch..进行异常捕捉 ...
- 每天学点Linux命令之 vi 命令
来学一个vi的命令.要完成的是在一个只读文件中,删掉一行,然后插入两行. 那只读文件你要修改,用sudo vi 总可以了吧.首先 vi命令进入编辑模式. 在非插入模式中: h 光标左移 l 光标右移 ...
- [转]android-学习笔记之按钮事件
本文转载自: http://zhangkun716717-126-com.iteye.com/blog/761080 前备知识: 1.需要了解怎么得到界面元素. 那么如何得到界面元素呢?在界面配置文件 ...
- 编写第一个HTML5文件
1.3.1 HTML文件的编写方法 编写HTML文件主要有如下3种方法: 手工直接编写 由于HTML语言编写的文件是标准的ASCII文本文件,所以我们可以使用任何的文本编辑器来打开并编写HTML文件 ...
- 《Java编程的逻辑》第一部分 编程基础与二进制
- 【PL/SQL】用星号拼出金字塔
代码中首先声明了几个变量,然后使用嵌套循环去输出空格和星号,其中: 每层空格数=总层数-该层层数 每层星号数=当前层数*2-1 代码如下: declare v_number1 ); --外层循环控制金 ...