“颠覆传统运维。”是 OneAPM CEO 陈旭经常挂在嘴边的一句话。为什么说 AIOps 将颠覆传统运维?如何才能把人工智能和运维管理相结合并落地?

2018年5月,OneAPM 推出了全新的 AIOps 平台 Intelligence Insight(简称 I2)并正式启用 aiops.com 域名作为企业级运维产品的官方网站。I2 是一个面向企业级 IT 运维管理现状,将多年领先的 ITOM 产品研发和实施经验与人工智能技术相结合,服务于 IT 和业务部门的全新智能运维管理平台。陈旭相信 I2 的发布将开启人工智能技术与传统运维碰撞颠覆的新时代。

以下是陈旭对 AIOps 的一些见解和分享。

AIOps 这个话题近两年开始在运维圈子里面火了起来。一夜间传统和新兴的运维管理软件供应商,IT 运维系统开发商,大数据厂商,人工智能算法提供商,还有 BAT,大家都在谈论这个话题。大有“谈运维不提 AI(人工智能)就有些落伍”之势。有人认为 AIOps 是一个运维数据集中存储和展示的平台,有人认为 AIOps 是一个大数据分析平台,有人认为 AIOps 是传统的一体化运维平台,也有不少运维大咖认为 AIOps 不过就是IT运维领域一个新的炒作点。我却认为 AIOps 是一场颠覆传统运维的盛筵。它更像是一只运维领域里面的灰犀牛,从远方奔腾而来,开始所有运维厂商都不觉得威胁很大,但是当它冲到近前,才发现势不可挡。读者可能认为这是在耸人听闻,请容我细细道来。

我们先来简单看一下 AIOps 的概念。AIOps 是由 Gartner 定义的 ITOM(IT Operations Management,IT 运维管理)新的领域。如下图所示,AIOps 利用大数据和机器学习技术,实现海量数据的异常检测和多维度关联分析,它将增强或部分取代 ITOM 领域的三个重要能力,即监测,服务管理和自动化,进一步帮助 IT 运维人员准确甄别系统异常,快速定位故障根因,并对潜在系统运行风险进行预警,以实现 IT 和业务的持续洞察和改进。

其次,AIOps 与传统运维工具相比较,至少具有三大杀手锏。

  • 一是,传统运维工具一个最大的问题就是运维指标采集维度过于单一,运维人员在使用传统运维工具进行故障诊断时,要同时从多种监控工具中得到不同维度的运维指标,然后再把这些数据在大脑里面相互关联并根据以往运维经验进行关联分析,以期能找到故障的真正原因。但是,AIOps 产品则完全区别于传统运维工具的数据使用方式,AIOps 产品会在底层通过统一的大数据平台把各类运维指标进行汇聚和加工,将性能指标、组件指标、网络指标、事件、告警、日志、工单等 IT 数据在统一的视图上进行关联展现,从而大大减少了运维人员的故障诊断时间,并提升了运维人员的故障诊断准确性。

  • 二是,传统运维工具由于体系架构比较陈旧、采集数据总量和维度又都相对有限,无法应用当下最先进的机器学习或者人工智能算法来快速诊断系统故障。而近两年才发展起来的 AIOps 平台则明显架构更加先进、一个平台可以很容易得汇聚海量、多维度的IT数据,能够接入多种机器学习和智能分析算法,通过对历史数据的训练,针对实时数据进行实时的异常检测、异常定位、根因分析、容量预测等,从而极大幅的降低现场故障处理时间,提升运维服务质量和最终用户体验

  • 三是,一个最让甲方运维领导头痛的事就是,由于传统运维工具通常由不同厂商提供,这就导致了甲方需要准备很多运维工程师在现场来使用不同厂商的运维产品做 IT 支撑保障。一旦 IT 系统发生故障,一个典型的场景就是,使用多个运维产品的工程师们聚在一起开会讨论,但是由于代表的各自利益不同,不同厂商运维人员现场开撕的情况比比皆是,实在令人无奈!这直接导致了传统的中大型企业日常需要大量的运维工程师驻场工作,必然会产生繁杂的现场管理矛盾,而且随着 IT 技术人员薪酬的持续攀升,运维驻场人员越来越稀缺和昂贵,IT 运维成本随之大幅增加。AIOps 平台则显著区别于传统运维工具,它完全不需要大量的运维人员。 平台自身可以采集多维度、海量的IT数据,只要有少量的熟悉 AIOps 产品的运维工程师即可实现中大型企业的日常 IT 支撑保障,由于 AIOps 将海量事件进行了聚合汇总分析,只产生少量的准确告警,有利于现场人员更加快速高效的处理现场故障,并支持将故障处理方法固化在知识库系统,以便于向更加智能的自动化运维演进。

综上所述,AIOps 的确是一场对于传统运维工具的颠覆革命,每个企业都应该从现在开始,关注并尝试使用智能运维平台。

OneAPM 全新推出新一代 AIOps 平台 I2,欢迎您随时联系我们,即刻开启贵公司的智能运维之旅。点击进入 AIOps 官网了解更多信息。

来源:http://blog.oneapm.com/apm-tech/813.html

AIOps 一场颠覆传统运维的盛筵的更多相关文章

  1. 百度云曲显平:AIOps时代下如何用运维数据系统性地解决运维问题?

    百度云智能运维负责人 曲显平 本文是根据百度云智能运维负责人曲显平10月20日在msup携手魅族.Flyme.百度云主办的第十三期魅族技术开放日<百度云智能运维实践>演讲中的分享内容整理而 ...

  2. 不看好运维竖井产品模式,优云打造融合化运维PaaS平台

    2018年1月13号中国双态运维用户大会上,优云软件总裁刘东海接受了36Kr记者的专访,期间谈到了新时代下的企业运维模式,新兴技术和传统运维的融合以及优云未来的发展方向等问题.以下为访谈实录: 优云软 ...

  3. 百度王一男: DevOps 的前提是拆掉业务-开发-测试-运维中间的三面墙

    这是一个创建于 375 天前的主题,其中的信息可能已经有所发展或是发生改变. 由数人云.优维科技.中生代社区联合发起的 系列 Meetup < DevOps&SRE 超越传统运维之道&g ...

  4. 《开源安全运维平台OSSIM最佳实践》

    <开源安全运维平台OSSIM最佳实践> 经多年潜心研究开源技术,历时三年创作的<开源安全运维平台OSSIM最佳实践>一书即将出版.该书用80多万字记录了,作者10多年的IT行业 ...

  5. 什么是业务运维,企业如何实现互联网+业务与IT的融合

    业务运维并不是一个新概念,针对传统信息架构提出的业务服务管理就是把以业务为核心的IT系统与IT基础设施性能进行整合运维的解决方案.然而随着互联网+转型的不断推进,基础设施的智能化和广泛云化成为IT发展 ...

  6. linux 运维,代理,acl控制访问

    运维概述:运行 & 维护,Operation & MaintanceIT运维.业务运维.日常管理运维采用相关的方法.手段.技术.制度.流程和文档等,对IT运行环境.IT业务系统和IT运 ...

  7. CMDB(Configuration Management Database)资产管理系统和 运维自动化

    一.传统运维方式和自动化运维的区别 二.CMDB的介绍 三.CMDB的四种方式 四.项目的目录架构介绍以及配置文件的升级编写 五.比较low的项目架构书写 六.可插拔式收集资产 七.对收集的服务器信息 ...

  8. 自动化运维之Saltstack

    第三十八课 自动化运维之Saltstack 目录 一.自动化运维介绍 二. saltstack安装 三. 启动saltstack服务 四. saltstack配置认证 五. saltstack远程执行 ...

  9. Cobbler自动化批量安装Linux操作系统 - 运维总结

    一.Cobbler简述 Cobbler是一个自动化和简化系统安装的工具,通过使用网络引导来控制和启动安装.Cobbler的特性包括存储库镜像.Kickstart模板和连接电源管理系统.Cobbler通 ...

随机推荐

  1. 机器学习基石笔记:10 Logistic Regression

    线性分类中的是非题------>概率题, 设置概率阈值后,大于等于该值的为O,小于改值的为X.------>逻辑回归. O为1,X为0: 逻辑回归假设: 逻辑函数/S型函数:光滑,单调, ...

  2. 6月份值得一看的 Java 技术干货!

    6月过完了,这一年都 TM 过了一半了,大家都回想下自己这大半年,你都收获了什么??技术有提升吗?对象搞定了吗? 说多了都是泪,唯有 WIFI.空调.西瓜.足球能够解忧.. 话说中国队怎么还不上场?哈 ...

  3. Java程序员必须掌握的常用Linux命令。

    Java程序员也是半个运维了,在日常开发中经常会接触到Linux环境操作.小公司的开发人员甚至是兼了全运维的工作,下面整理了一些常用的Linux操作命令. Linux常用指令 ls 显示文件或目录 - ...

  4. url参数+,&,=,/等转义编码

    url出现了有+,空格,/,?,%,#,&,= 等特殊符号的时候,可能在服务器端无法获得正确的参数值. 案例: <img src="BarCode39.aspx?barcode ...

  5. Go语言总结

  6. Kafka实战-简单示例

    1.概述 上一篇博客<Kafka实战-Kafka Cluster>中,为大家介绍了Kafka集群的安装部署,以及对Kafka集群Producer/Consumer.HA等做了相关测试,今天 ...

  7. Docker上运行MySQL服务

    1.搜索MySQL镜像 $ docker search mysql INDEX NAME DESCRIPTION STARS OFFICIAL AUTOMATED docker.io docker.i ...

  8. quartz配置参数org.quartz.jobStore.misfireThreshold含义解释

    配置定时任务参数 quartz.properties文件时 需要配置jobStore的超过时间数 默认为60秒(这里单位为毫秒) org.quartz.jobStore.misfireThreshol ...

  9. docker化java web应用

    一.简介 Docker是一个使用Go语言开发的开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的机器上.Docker的发展速度和火爆程度着实令人惊叹,一 ...

  10. 【P2P浏览器】跟大家讨论一个想法

    内容分享者通过这个浏览器来创建自己待分享的内容 任谁看了这些内容,就会在本地保存一份,成为一个节点只要任一个节点在线,别人就能看这些内容在线的节点越多,获取这些内容的速度越快 任何使用这个浏览器的人, ...