“颠覆传统运维。”是 OneAPM CEO 陈旭经常挂在嘴边的一句话。为什么说 AIOps 将颠覆传统运维?如何才能把人工智能和运维管理相结合并落地?

2018年5月,OneAPM 推出了全新的 AIOps 平台 Intelligence Insight(简称 I2)并正式启用 aiops.com 域名作为企业级运维产品的官方网站。I2 是一个面向企业级 IT 运维管理现状,将多年领先的 ITOM 产品研发和实施经验与人工智能技术相结合,服务于 IT 和业务部门的全新智能运维管理平台。陈旭相信 I2 的发布将开启人工智能技术与传统运维碰撞颠覆的新时代。

以下是陈旭对 AIOps 的一些见解和分享。

AIOps 这个话题近两年开始在运维圈子里面火了起来。一夜间传统和新兴的运维管理软件供应商,IT 运维系统开发商,大数据厂商,人工智能算法提供商,还有 BAT,大家都在谈论这个话题。大有“谈运维不提 AI(人工智能)就有些落伍”之势。有人认为 AIOps 是一个运维数据集中存储和展示的平台,有人认为 AIOps 是一个大数据分析平台,有人认为 AIOps 是传统的一体化运维平台,也有不少运维大咖认为 AIOps 不过就是IT运维领域一个新的炒作点。我却认为 AIOps 是一场颠覆传统运维的盛筵。它更像是一只运维领域里面的灰犀牛,从远方奔腾而来,开始所有运维厂商都不觉得威胁很大,但是当它冲到近前,才发现势不可挡。读者可能认为这是在耸人听闻,请容我细细道来。

我们先来简单看一下 AIOps 的概念。AIOps 是由 Gartner 定义的 ITOM(IT Operations Management,IT 运维管理)新的领域。如下图所示,AIOps 利用大数据和机器学习技术,实现海量数据的异常检测和多维度关联分析,它将增强或部分取代 ITOM 领域的三个重要能力,即监测,服务管理和自动化,进一步帮助 IT 运维人员准确甄别系统异常,快速定位故障根因,并对潜在系统运行风险进行预警,以实现 IT 和业务的持续洞察和改进。

其次,AIOps 与传统运维工具相比较,至少具有三大杀手锏。

  • 一是,传统运维工具一个最大的问题就是运维指标采集维度过于单一,运维人员在使用传统运维工具进行故障诊断时,要同时从多种监控工具中得到不同维度的运维指标,然后再把这些数据在大脑里面相互关联并根据以往运维经验进行关联分析,以期能找到故障的真正原因。但是,AIOps 产品则完全区别于传统运维工具的数据使用方式,AIOps 产品会在底层通过统一的大数据平台把各类运维指标进行汇聚和加工,将性能指标、组件指标、网络指标、事件、告警、日志、工单等 IT 数据在统一的视图上进行关联展现,从而大大减少了运维人员的故障诊断时间,并提升了运维人员的故障诊断准确性。

  • 二是,传统运维工具由于体系架构比较陈旧、采集数据总量和维度又都相对有限,无法应用当下最先进的机器学习或者人工智能算法来快速诊断系统故障。而近两年才发展起来的 AIOps 平台则明显架构更加先进、一个平台可以很容易得汇聚海量、多维度的IT数据,能够接入多种机器学习和智能分析算法,通过对历史数据的训练,针对实时数据进行实时的异常检测、异常定位、根因分析、容量预测等,从而极大幅的降低现场故障处理时间,提升运维服务质量和最终用户体验

  • 三是,一个最让甲方运维领导头痛的事就是,由于传统运维工具通常由不同厂商提供,这就导致了甲方需要准备很多运维工程师在现场来使用不同厂商的运维产品做 IT 支撑保障。一旦 IT 系统发生故障,一个典型的场景就是,使用多个运维产品的工程师们聚在一起开会讨论,但是由于代表的各自利益不同,不同厂商运维人员现场开撕的情况比比皆是,实在令人无奈!这直接导致了传统的中大型企业日常需要大量的运维工程师驻场工作,必然会产生繁杂的现场管理矛盾,而且随着 IT 技术人员薪酬的持续攀升,运维驻场人员越来越稀缺和昂贵,IT 运维成本随之大幅增加。AIOps 平台则显著区别于传统运维工具,它完全不需要大量的运维人员。 平台自身可以采集多维度、海量的IT数据,只要有少量的熟悉 AIOps 产品的运维工程师即可实现中大型企业的日常 IT 支撑保障,由于 AIOps 将海量事件进行了聚合汇总分析,只产生少量的准确告警,有利于现场人员更加快速高效的处理现场故障,并支持将故障处理方法固化在知识库系统,以便于向更加智能的自动化运维演进。

综上所述,AIOps 的确是一场对于传统运维工具的颠覆革命,每个企业都应该从现在开始,关注并尝试使用智能运维平台。

OneAPM 全新推出新一代 AIOps 平台 I2,欢迎您随时联系我们,即刻开启贵公司的智能运维之旅。点击进入 AIOps 官网了解更多信息。

来源:http://blog.oneapm.com/apm-tech/813.html

AIOps 一场颠覆传统运维的盛筵的更多相关文章

  1. 百度云曲显平:AIOps时代下如何用运维数据系统性地解决运维问题?

    百度云智能运维负责人 曲显平 本文是根据百度云智能运维负责人曲显平10月20日在msup携手魅族.Flyme.百度云主办的第十三期魅族技术开放日<百度云智能运维实践>演讲中的分享内容整理而 ...

  2. 不看好运维竖井产品模式,优云打造融合化运维PaaS平台

    2018年1月13号中国双态运维用户大会上,优云软件总裁刘东海接受了36Kr记者的专访,期间谈到了新时代下的企业运维模式,新兴技术和传统运维的融合以及优云未来的发展方向等问题.以下为访谈实录: 优云软 ...

  3. 百度王一男: DevOps 的前提是拆掉业务-开发-测试-运维中间的三面墙

    这是一个创建于 375 天前的主题,其中的信息可能已经有所发展或是发生改变. 由数人云.优维科技.中生代社区联合发起的 系列 Meetup < DevOps&SRE 超越传统运维之道&g ...

  4. 《开源安全运维平台OSSIM最佳实践》

    <开源安全运维平台OSSIM最佳实践> 经多年潜心研究开源技术,历时三年创作的<开源安全运维平台OSSIM最佳实践>一书即将出版.该书用80多万字记录了,作者10多年的IT行业 ...

  5. 什么是业务运维,企业如何实现互联网+业务与IT的融合

    业务运维并不是一个新概念,针对传统信息架构提出的业务服务管理就是把以业务为核心的IT系统与IT基础设施性能进行整合运维的解决方案.然而随着互联网+转型的不断推进,基础设施的智能化和广泛云化成为IT发展 ...

  6. linux 运维,代理,acl控制访问

    运维概述:运行 & 维护,Operation & MaintanceIT运维.业务运维.日常管理运维采用相关的方法.手段.技术.制度.流程和文档等,对IT运行环境.IT业务系统和IT运 ...

  7. CMDB(Configuration Management Database)资产管理系统和 运维自动化

    一.传统运维方式和自动化运维的区别 二.CMDB的介绍 三.CMDB的四种方式 四.项目的目录架构介绍以及配置文件的升级编写 五.比较low的项目架构书写 六.可插拔式收集资产 七.对收集的服务器信息 ...

  8. 自动化运维之Saltstack

    第三十八课 自动化运维之Saltstack 目录 一.自动化运维介绍 二. saltstack安装 三. 启动saltstack服务 四. saltstack配置认证 五. saltstack远程执行 ...

  9. Cobbler自动化批量安装Linux操作系统 - 运维总结

    一.Cobbler简述 Cobbler是一个自动化和简化系统安装的工具,通过使用网络引导来控制和启动安装.Cobbler的特性包括存储库镜像.Kickstart模板和连接电源管理系统.Cobbler通 ...

随机推荐

  1. SQL分别求行、列的平均值

    日常工作中,会需要用SQL求平均值,分别是求某一项的平均值或求某一个对象的平均值,放到表格就是求一行中的几个字段的平均值和求一列的平均值. 第一种:[列的平均值]AVG:这个函数相信大家都不陌生的,求 ...

  2. 如何才能够系统地学习Java并发技术?

    微信公众号[Java技术江湖]一位阿里Java工程师的技术小站 Java并发编程一直是Java程序员必须懂但又是很难懂的技术内容. 这里不仅仅是指使用简单的多线程编程,或者使用juc的某个类.当然这些 ...

  3. 这是一位拿到BAT大厂offer应届生的年终总结,那么你的呢?

    壹 关于求职 2018年初,我还在北京后厂村的马路上被风吹得瑟瑟发抖. 那时我刚刚结束了半年的实习时光,开始考虑年后是否要继续实习.一开始我也在纠结实习转正和秋招之间如何权衡,但是在经历了春招以后,我 ...

  4. react 字符串强转为html标签

    react中,富文本编辑 从数据库取出来 是带标签的 字符串,需要强转为 节点 <div dangerouslySetInnerHTML={{ __html: this.state.obj.ht ...

  5. Java并发编程笔记之PriorityBlockingQueue源码分析

    JDK 中无界优先级队列PriorityBlockingQueue 内部使用堆算法保证每次出队都是优先级最高的元素,元素入队时候是如何建堆的,元素出队后如何调整堆的平衡的? PriorityBlock ...

  6. 获取DNS服务器的版本信息

    1 如何获取DNS服务器的版本信息 向某个DNS服务器发送下面的请求即可获得版本信息 dig @115.124.17.156 version.bind chaos txt 它返回的信息如下: ; &l ...

  7. flask数据库迁移理解及命令

    前言: 使用数据库迁移,可以直接建表,而不用我们自己写sql语句用来建表.就是将关系型数据库的一张张表转化成了Python的一个个类. 在开发中经常会遇到需要修改原来的数据库模型,修改之后更新数据库, ...

  8. Cassandra 数据模型

    Cassandra的数据模型类似于关系型数据库的模型,且提供了与SQL语言非常类似的CQL语言进行操作. 但是Cassandra的数据模型类似于多层键值对结构,与关系型数据库存在巨大差别. 本文基于: ...

  9. MySQL实验准备(二)--Python模拟数据(MySQL数据库)

    Python模拟数据(MySQL数据库) 数据模拟 目的:模拟多个表的插入和查询数据的模拟,再通过基准测试脚本测试服务器性能和收集数据,仿真模拟. 备注: 如果需要基础的python环境,可以查看&l ...

  10. Nuget快捷实践

    Nuget快捷实践 简介 本文主要包含三个部分,即创建nuget包.上传nuget包和删除nuget包.旨在引导快速使用nuget打包和使用,并实现对于nuget的简单管理. 本文使用的nuget服务 ...