正如你们看到的那样,到目前为止(OpenStack Kilo),OpenStack自己的监控组件Telemetry并不是完美,

获取的监控数据以及制作出来的图表有时候让人匪夷所思,因其重点并不是监控而是计费。

我们不仅要监控云平台中每个节点的资源使用状况,如CPU使用率,内存使用率,磁盘使用率以及带宽等,

还需要检查OpenStack的各个服务的运行情况。通过对比研究Nagios, Cacti, Zabbix等等,认为Nagios是比较适合的。

Nagios本身并不提供检测工具,它类似于一个信息收集与处理中心(或者平台),所有的检测工作都是通过插件(Plugin)来完成的,

而这些Plugin可以通过很多语言来实现,比如CPythonShellPerl等等。

至于Nagios的其他优点和功能特性,这里无需多言,感兴趣的童鞋可以参考Nagios 监控系统架设全攻略

不过Nagios收集的是实时数据,而且无法通过图表查看历史趋势,很多人推荐使用 Pnp4Nagios,但是Pnp4Nagios安装相对来说比较费事,

其依赖的软件比较多,而且很多时候由于与Nagios版本不兼容导致问题发生无从下手。这里推荐使用Nagiosgraph

下面以我的实验环境为例,简要介绍OpenStack的监控解决方案:

整个云平台由四台物理节点(控制节点,计算节点,网络节点以及块存储节点)构成,主机操作系统采用 Ubuntu Server 14.04 TLS

  • 以控制节点为Nagios服务器,其他节点作为被监控对象(Nagios Server同时监控自己)

    控制节点:
apt-get install nagios3 nagios-nrpe-plugin
htpasswd /etc/nagios3/htpasswd.users nagiosadmin
htpasswd /etc/nagios3/htpasswd.users steve

其他节点:

apt-get install nagios-nrpe-server

其他的配置请参考Ubuntu Monitoring

  • Nagios 服务器上安装Nagiosgraph
wget http://sourceforge.net/projects/nagiosgraph/files/nagiosgraph/1.5.2/nagiosgraph-1.5.2.tar.gz
tar zxvfnagiosgraph-1.5.2.tar.gz
cd nagiosgraph-1.5.2
./install.pl
  • Nagiosgraph的配置
  1. 修改 Nagios 配置文件 nagios.cfg
process_performance_data=1
service_perfdata_file=/tmp/perfdata.log
service_perfdata_file_template=$LASTSERVICECHECK$||$HOSTNAME$||$SERVICEDESC$||$SERVICEOUTPUT$||$SERVICEPERFDATA$
service_perfdata_file_mode=a
service_perfdata_file_processing_interval=30
service_perfdata_file_processing_command=process-service-perfdata-for-nagiosgraph
  1. 修改Nagios命令文件 commands.cfg
define command {
command_name process-service-perfdata-for-nagiosgraph
command_line /usr/local/nagiosgraph/bin/insert.pl
}
  1. 修改Apache配置文件
Include /usr/local/nagiosgraph/etc/nagiosgraph-apache.conf

由于新版的Ubuntu对Apache修改比较大,比较新的Ubuntu版本Apache配置文件默认路径为 /etc/apache2/apache2.conf

  1. 修改/usr/local/nagiosgraph/etc/nagiosgraph-apache.conf
ScriptAlias /nagiosgraph/cgi-bin "/usr/local/nagiosgraph/cgi"
<Directory "/usr/local/nagiosgraph/cgi">
Options ExecCGI
AllowOverride None
Order allow,deny
Allow from all
AuthName "Nagios Access"
AuthType Basic
AuthUserFile /etc/nagios3/htpasswd.users
Require valid-user
</Directory>
# enable nagiosgraph CSS and JavaScript
Alias /nagiosgraph "/usr/local/nagiosgraph/share"
<Directory "/usr/local/nagiosgraph/share">
Options None
AllowOverride None
Order allow,deny
Allow from all
AuthName "Nagios Access"
AuthType Basic
AuthUserFile /etc/nagios3/htpasswd.users
Require valid-user
</Directory>

如果不添加 AuthName等4行,会出现诸如Server Forbidden Javascript Disable 等问题。

  • Nagiosgraph的连接添加到Nagios页面中
<?php $nagiosgraph_path = '/nagiosgraph/cgi-bin'; /* 因为cgi文件不是安装在nagios下的,所以要配置好路径 */?>
<li><a href="<?php echo $nagiosgraph_path;?>/trends.cgi" target="<?php echo $link_target;?>">Trends</a>
<ul>
<li><a href="<?php echo $nagiosgraph_path;?>/show.cgi" target="<?php echo $link_target;?>">Graphs</a></li>
<li><a href="<?php echo $nagiosgraph_path;?>/showhost.cgi" target="<?php echo $link_target;?>">Graphs by Host</a></li>
<li><a href="<?php echo $nagiosgraph_path;?>/showservice.cgi" target="<?php echo $link_target;?>">Graphs by Service</a></li>
<li><a href="<?php echo $nagiosgraph_path;?>/showgroup.cgi" target="<?php echo $link_target;?>">Graphs by Group</a></li>
</ul>
</li>
  • 安装Nagios Openstack Plugin(在控制节点上)
apt-get install nagios-plugins*

通过上面命令,你会看到 /usr/lib/plug-in/目录下出现很多检查工具,包括check_novaapi, check_keystone等等,

至于如果使用和配置这些plug-in, 可以参考Monitor Openstack

至此,OpenStack的监控方案得以完美实施。

OpenStack 监控解决方案的更多相关文章

  1. IT运维监控解决方案介绍

    现状 •小公司/ 创业团队< 500台服务器规模 开源方案:Zabbix.Nagios.Cacti- 云服务提供商:监控宝.oneAlert等 •BAT级别> 10万台服务器 投 ...

  2. 初识Opserver,StackExchange的监控解决方案

    Opserver是闻名遐迩的网站Stack Overflow的开源监控解决方案,由Stack Exchange发布.它基于.NET框架构建,这在监控工具领域有些与众不同. 旨在为每个受监控系统的健康状 ...

  3. Zabbix监控解决方案

    思通运维监控主要用来监控IT 基础设施组件的可用性和性能.监控项目是不受限制的,并且可以对IT 基础设施健康状态进行复杂分析.通过确定IT 系统问题的“来源”,使用户快速响应故障来降低宕机成本. 网络 ...

  4. Azure 为 SAP 提供的增强监控解决方案

    正如大家在之前公告中所看到的,多个SAP应用程序已获得认证可在 Azure虚拟机中运行,未来还会有更多 SAP应用程序获得认证.对于希望在 Azure中运行 SAP应用程序的客户来说,这是个激动人心的 ...

  5. Promethus+Grafana监控解决方案

    [MySQL]企业级监控解决方案Promethus+Grafana Promethus用作监控数据采集与处理,而Grafana只是用作数据展示 一.Promethus简介 Prometheus(普罗米 ...

  6. 减轻集群负载、三种k8s 替代openstack的解决方案

    减轻集群负载.三种k8s 替代openstack的解决方案 待办 https://news.ycombinator.com/item?id=17013779 kubevirt https://host ...

  7. zabbix企业级的分布式开源监控解决方案 v5.0 LTS

    目录 zabbix简介 服务模块 客户端守护进程 监控流程 功能拆解 安装 zabbix 5.0 LTS 参考官网 zabbix 5.0.12-1.el7 zabbix-server相关优化 1. 字 ...

  8. Greenplum数仓监控解决方案(开源版本)

    Greenplum监控解决方案 基于Prometheus+Grafana+greenplum_exporter+node_exporter实现 关联图 一.基本概念 1.Prometheus ​ Pr ...

  9. Zabbix企业级开源监控解决方案

    Zabbix企业级开源监控解决方案 目录 Zabbix企业级开源监控解决方案 一.Zabbix 1. 监控系统的必要性 2. 监控软件的作用 3. Zabbix的定义 4. Zabbix的监控原理 5 ...

随机推荐

  1. Virtual Table

    C++对象模型——吴泰 C/C++杂记 C++中的虚函数(表)实现机制以及用C语言对其进行的模拟实现 C++ 多继承和虚继承的内存布局 [已翻译100%] (虚继承参考,推荐) 图说C++对象模型:对 ...

  2. Java应用中使用ShutdownHook友好地清理现场

    在线上Java程序中经常遇到进程程挂掉,一些状态没有正确的保存下来,这时候就需要在JVM关掉的时候执行一些清理现场的代码.Java中得ShutdownHook提供了比较好的方案. JDK在1.3之后提 ...

  3. 【NOI】荷马史诗

    追逐影子的人,自己就是影子 ——荷马 Allison最近迷上了文学.她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的<荷马史诗>.但是由<奥德赛>和< ...

  4. All flavors must now belong to a named flavor dimension

    FAQ: All flavors must now belong to a named flavor dimension. Learn more at https://d.android.com/r/ ...

  5. HDU 5306 线段树

    吉司机课件题. 区间min,区间最值,区间和. 如果用最大值和次大值能更新区间和那就更新打标记,否则暴力dfs. #include<iostream> #include<cstdio ...

  6. BP神经网络人口预测程序(matlab实现)

    自己测试人口预测的matlab实现: x=[54167    55196    56300    57482    58796    60266    61465    62828    64653  ...

  7. insert sort

    插入排序将数据分为前面有序部分和后面无序部分,取无序部分的第一个元素插入到有序序列中. 注意与选择排序的区别. // insert sortvoid insertionSort(int arr[], ...

  8. Android am命令使用

    一.开启Activity.服务.广播 1.开启Activity.服务.广播基础知识 通过adb shell,可以使用activity manager(arm)工具来执行不同的系统操作,如开启一个act ...

  9. noi题库(noi.openjudge.cn) 1.13编程基础之综合应用 T12 分数求和

    12:分数求和 描述 输入n个分数并对他们求和,并用最简形式表示.所谓最简形式是指:分子分母的最大公约数为1:若最终结果的分母为1,则直接用整数表示. 如:5/6.10/3均是最简形式,而3/6需要化 ...

  10. Codeforces Round #476 (Div. 2) [Thanks, Telegram!] C

    http://codeforces.com/contest/965/problem/C 题目大意:n个糖,k个人,每次最多只能拿M个糖,从第一个人开始拿,可以循环D次.问Arkady最多可以拿几块糖? ...