IT集中监控
监控的从底层到上应该是:
一 数据采集层
二 数据处理层
三 数据展示层
监控需要和ITIL中定义的服务进行相当多的交互,例如监控会使用配置管理数据库CMDB来记录和读取数据,会将事件处理方式从知识库(存储IT知识)写入或者读出,会和流程及自动化管理平台(负责流程处理和生产等变更)进行联动处理事件或者服务请求。
一个个来看看,首先是数据采集,数据采集可以分为物理资源数据采集,应用数据采集和交易信息数据采集。
物理资源包括服务器软件、服务器硬件、网络、存储、机房环境等,这些监控数据的采集一般采用成熟的第三方软件,例如网络监控可以采用netcool,服务器硬件可以采用HP SIM,服务器软件和应用可以采用BMC Performance Manager。
端到端的交易个性比较强烈,一般都需要自己开发了。无非也就是根据业务在信息系统内的流向,建立交易在信息系统的流向关系分析(也就是应用影响分析)。
数据处理包括事件和灾难管理处理平台、应用及交易性能分析平台等
数据展示是为了将监控信息呈现给使用者。
例如:当数据采集层的NETCOOL工具检测到一个服务器网络中断事件时,会将事件送到数据处理层,数据处理层的事件处理平台从知识库中获得该事件以前的处理经验,然后流程及自动化管理平台会形成事件单并从知识库中获取可能的解决方案开始按照既定流程进行处理并保存处理结果。流程及自动化管理平台同时需要负责事件任务的调度。
重点难点:
1 将事件分为合适的级别和类型、统一事件编码
2 梳理所有事件的处理流程和解决方案,能做到动态自动更新,最终实现出现过的问题能自动处理。
3 结合应用影响分析和业务影响分析,梳理需要监控的端到端交易和交易依赖的IT环境。作歹交易失败后的事件精准快速定位。
4 虚拟化或者云环境下监控会相对来说更复杂,特别用了很多虚拟化技术(VPLEX\SVC\KVM\VSPHERE|powervm等等),这时候就需要采用各方的虚拟化监控和管理软件,然后在自己做集成开发,但是最好的方法我认为还是自己开发,在风险可控的情况下,金融业一定要学习互联网行业的成功的经验。互联网会对一切有超额利润的行业开战,这是互联网的天性,对于金融IT业一定要有前瞻。
5 多数据中心会给监控带来挑战,一般的解决方法是多中心部署采集层,但是只在一个中心进行数据分析,然后将数据分析结果同步到其他中心进行只读的展示。
监控产品的文章可以网上搜索,很多的,很多需要自己写一下shell脚本,这里不在累赘了。
IT集中监控的更多相关文章
- zabbix3.2利用自动发现功能对fastcgi模式的php状态进行集中监控
zabbix3.2利用自动发现功能对fastcgi模式的php状态进行集中监控 前端nginx虚拟主机引用后端多个php接口,为了方便监控,将后端服务器集中配置在nginx中,具体配置如下: [roo ...
- SNMP简单网络管理协议
声明:以下内容是学习谌玺老师视频整理出来(http://edu.51cto.com/course/course_id-861.html) SNMP(Simple Network Management ...
- redis安装及基础操作(1)
============================================================= 编译安装 0.环境 Linux:centos6.5 redis:3.0.5 ...
- V$RMAN_BACKUP_JOB_DETAILS
V$RMAN_BACKUP_JOB_DETAILS展示了rman备份的相关细节.比如,rman备份持续时间.rman备份的执行次数.每一次rman备份工作的状态(failed or completed ...
- elixir 高可用系列(二) GenServer
概述 如果我们需要管理多个进程,那么,就需要一个专门的 server 来集中监控和控制这些进程的状态,启停等. OTP 平台中的 GenServer 就是对这个 server 通用部分的抽象. 利用 ...
- httpclient 认证方式访问http api/resutful api并获取json结果
最近,因公司线上环境rabbitmq经常发生堆积严重的现象,于是跟运维组讨论,帮助开发个集中监控所有rabbitmq服务器运行情况的应用,需要通过java访问rabbitmq暴露的http api并接 ...
- 【云计算】实战-五个Docker监控工具的对比
[实战]五个Docker监控工具的对比 阅读目录 Docker Stats命令 CAdvisor Scout Data Dog Sensu Monitoring Framework 总结 这篇文章作者 ...
- Spring Web Flow 简介
Spring Web Flow 简介 博客分类: 转载 SSH 最近在TSS上看到了一片介绍Spring Web Flow的文章,顺便就翻译了下来,SWF的正式版估计要到6月份才能看到了,目前的例子都 ...
- Centos7搭建集中式日志系统
在CentOS7中,Rsyslong是一个集中式的日志收集系统,可以运行在TCP或者UDP的514端口上. 目录 开始之前 配置接收日志的主机 配置发送日志的主机 日志回滚 附件:创建日志接收模板 ...
随机推荐
- Exadata 18.1新特性--云平台存储节点升级
1.传统方式的存储节点升级流程: (1).将存储节点升级包下载到数据库服务器,通常是DB01上. (2).解压缩存储节点升级包. (3).用升级包中的patchmgr工具滚动或非滚动地升级每个存储节点 ...
- 【转】idea新建项目文件名为红色的解决办法
idea如果当前project用了版本控制器,其下面新建的所有的项目默认都是加入到版本控制里面,所以项目名称和文件都是红色的. 解决办法: ctrl + alt + s 进入设置界面,–>ver ...
- AndroidManifest.xml警告
新建一个android项目后,AndroidManifest.xml有一个黄色警告 作为一个新手,不知道这个警告来自哪里,点击界面下方的不同标签,才知道来自图中的位置 第8行中,application ...
- 【算法笔记】B1022 D进制的A+B
1022 D进制的A+B (20 分) 输入两个非负 10 进制整数 A 和 B (≤230−1),输出 A+B 的 D (1<D≤10)进制数. 输入格式: 输入在一行中依次给出 3 个 ...
- 【算法笔记】B1011 A+B 和 C
1011 A+B 和 C (15 分) 给定区间 [−231,231] 内的 3 个整数 A.B 和 C,请判断 A+B 是否大于 C. 输入格式: 输入第 1 行给出正整数 T (≤10 ...
- BZOJ 2935/ Poi 1999 原始生物
[bzoj2935][Poi1999]原始生物 2935: [Poi1999]原始生物 Time Limit: 3 Sec Memory Limit: 128 MBSubmit: 145 So ...
- ul模拟select,位置,数据,是否可输入及输入提示效果都可作为参数直接传入
转发请注明出处,虽然转发几率不大... HTML <span class="theContainer"></span> CSS body {padding: ...
- vue 同一个组件的跳转, 返回时保留原来的下拉位置
1,需求分析 公司的项目有这样一个需求: 同一个list组件,根据传过来的listId渲染成多个页面,每个页面都可以下拉.在返回到不同的list页面时,要保留当时下拉的位置. 说的我自己都有点懵逼了, ...
- 《The Python Tutorial》——Errors and Exceptions 阅读笔记
Errors and Exceptions 官方文档:https://docs.python.org/3.5/tutorial/errors.html python中所有的异常都继承自BaseExce ...
- oracle 基础知识(十四)----索引扫描
(1)索引唯一扫描(index unique scan) 通过唯一索引查找一个数值经常返回单个ROWID.如果该唯一索引有多个列组成(即组合索引),则至少要有组合索引的引导列参与到该查询中,如创建一个 ...