OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。有了 OneAlert,你可以更快更合理地为事件划分优先级、分配路径,从而极大地提高团队的协作能力、优化协作流程。本文是 OneAlert 入门系列文章的第三篇,将帮助你快速了解和配置 OneAlert,从而挖掘该平台的最大价值。

事件分析

你此前用过的大多数工单系统或问题追踪系统都会要求你手动分类或联结工单。OneAlert 可不一样。OneAlert 事件流中的每个事件都是自动创建的,且以监控栈中实时产生的告警为基础。ZabbixNagios ,Solarwinds ,AWS CloudWatch ,阿里云 ,监控宝,腾讯云等国内外主流监控工具都能支持,而且新的应用正在快速集成。只要该工具会给 IT 和 DevOps(运维开发团队)产生告警,我们都会想办法与之集成。OneAlert 除了可以做一名合格的告警搬运工,还提供事件分析功能,目前包括总览、告警 Top 分析、告警压缩、应用,即将上线的还有面向 Team Leader 的团队分析、成员分析、通知分析功能。

Top分析----对告警内容和对象进行深入分析

OneAlert 提供两种 Top 分析,一种是根据告警内容产生告警的频繁次数进行排名分析;一种是根据告警对象产生告警的频繁次数进行排名分析。我们可以直观的看到哪些事件发生故障的次数排名,这样我们可以有针对的排除发生故障的原因,预防下次还频繁发生故障。我们还可以看相应告警的持续时间和 MTTA / MTTR,可以查看团队的工作效率,从而继续优化团队排班和升级策略。

告警压缩----减少噪音

生产环境中的一个问题可能导致多个告警。例如,一个磁盘问题可能会先导致磁盘 IO 告警。后者又很可能迅速触发一些列的 CPU,内存,数据库及应用告警。当然,在这种情况下,你可不想分开管理二十多个问题。实际上,它们都是同一个原因导致的。因此,OneAlert 会自动进行分组,将相关的告警整合为高级事件。OneAlert 的分组算法会使用主机名、集群和应用等信息,确保所有相关告警都分到同一组内。未来还会根据集群、应用和团队职责等进行分组。此外,算法还会考虑告警出现的时间顺序,使你对事件的了解更加深入。

前沿分享

以上事件分析功能主要面向运营团队的一线人员,未来我们将推出面向 Team Leader 的团队分析、成员分析、通知分析功能。让 Team Leader 可以直观看出团队设置的排版和升级策略是否需要继续优化,也可以看出每个人的确认告警的时间和解决故障的时间,查看整个团队和成员的工作效率。更多功能敬请期待。

OneAlert 能够实时地自动整合告警,并且通过多链路多种通知方式让告警最有效率的通知到相关人员,极大的缩短 MTTR,最后事件分析功能让团队价值最大化。这使 OneAlert 成为国内 IT 与 DevOps 团队管理并解决问题的最佳平台。在第四部分,我们会介绍如何在整个团队中使用该工具,从而最大限度地提高协作效率。

本文转自 OneAPM 官方博客

OneAlert 入门(三)——事件分析的更多相关文章

  1. OneAlert 入门(二)——事件分析

    OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性.有了 OneAlert,你可以更快更合理地为事件划分 ...

  2. OneAlert 入门(四)——事件分派和通知必达

    OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性.有了 OneAlert,你可以更快更合理地为事件划分 ...

  3. OneAlert 入门(一)——事件流

    OneAlert 入门(一)--事件流 OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性.它能以史上第 ...

  4. 脑残式网络编程入门(三):HTTP协议必知必会的一些知识

    本文原作者:“竹千代”,原文由“玉刚说”写作平台提供写作赞助,原文版权归“玉刚说”微信公众号所有,即时通讯网收录时有改动. 1.前言 无论是即时通讯应用还是传统的信息系统,Http协议都是我们最常打交 ...

  5. 爬虫入门三 scrapy

    title: 爬虫入门三 scrapy date: 2020-03-14 14:49:00 categories: python tags: crawler scrapy框架入门 1 scrapy简介 ...

  6. 3.Python爬虫入门三之Urllib和Urllib2库的基本使用

    1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS.CSS ...

  7. WPF入门(三)->几何图形之不规则图形(PathGeometry)

    原文:WPF入门(三)->几何图形之不规则图形(PathGeometry) 前面我们给大家介绍了LineGeometry,EllipseGeometry,CombinedGeometry等一些规 ...

  8. C#线程学习笔记十:async & await入门三

    一.Task.Yield Task.Yield简单来说就是创建时就已经完成的Task,或者说执行时间为0的Task,或者说是空任务,也就是在创建时就将Task的IsCompeted值设置为0. 我们知 ...

  9. IM开发者的零基础通信技术入门(三):国人通信方式的百年变迁

    [来源申明]本文原文来自:微信公众号“鲜枣课堂”,官方网站:xzclass.com,原题为:<中国通信的百年沉浮>,本文引用时已征得原作者同意.为了更好的内容呈现,即时通讯网在收录时内容有 ...

随机推荐

  1. 一行 Python 代码搞定一棵树

    使用 Python 内建的 defaultdict 方法可以轻松定义一个树的数据结构. 简单的说树也可以是一个字典数据结构           Python   1 def tree(): retur ...

  2. ALTER---为已创建的表添加默认值

    alter table table_name modify column_name default default_value; 例: alter table userinfo modify emai ...

  3. IEnumerable 和 IQueryable

    共有两组 LINQ 标准查询运算符,一组在类型为 IEnumerable<T> 的对象上运行,另一组在类型为 IQueryable<T> 的对象上运行.构成每组运算符的方法分别 ...

  4. Spring整合JMS(一)——基于ActiveMQ实现

    1.1     JMS简介 JMS的全称是Java Message Service,即Java消息服务.它主要用于在生产者和消费者之间进行消息传递,生产者负责产生消息,而消费者负责接收消息.把它应用到 ...

  5. Java Socket简例

    Socket IO工具类: package com.test.util; import java.io.DataInputStream; import java.io.DataOutputStream ...

  6. 简单的实现QQ通信功能(一)

    第一部分:数据库的设计,数据集的建立 一:数据库的设计: 1.用户表:包含用户名.密码.昵称.性别.备注.状态.头像代号和最后登录时间. 2.朋友关系表:自增长列为主键列,用户名和好友名,还有朋友的状 ...

  7. HDU-1002(简单大数加法)

    A + B Problem II Problem Description I have a very simple problem for you. Given two integers A and ...

  8. web页面的生命周期

    1.先上几张原理图着重理解: 现在针对第四副图原理进行解析: 流程: 1.浏览器发送请求 2.服务器软件(IIS)接收,它最终的目的就是为了向客户输出它请求的动态页面生成的html代码. 3.服务器不 ...

  9. 10.12_win8风格,把专业书籍当小说看,SQLite

    (1)CSS:Metro UI CSS(Metroui) 是一套实现了 Windows 8 的 Metro 风格界面的 CSS 框架..官网.BootMetro . (2)[开源访谈]CecOS作者 ...

  10. MongoDB源码分析——mongod程序源码入口分析

    Edit 说明:第一次写笔记,之前都是看别人写的,觉得很简单,开始写了之后才发现真的很难,不知道该怎么分析,这篇文章也参考了很多前辈对MongoDB源码的分析,也有一些自己的理解,后续将会继续分析其他 ...