大数网 吴玉征

先说个真实的故事。

前一段时间,有一家知名的国际连锁咖啡公司的自助交易系统(支付宝、微信、ApplePAY)特别慢,工作人员也不知道为什么。由于他们刚上了业务运维,支持这套系统的云智慧后台管理人员通过数据一层层梳理,最后确定到某个区域的某个数据中心的某一块硬盘缓存溢满,导致交易变慢。找到并解决问题之后,该咖啡连锁店一下午挽回好几万笔的交易数。

为什么这么大量?因为一旦手机支付存在问题,大量用户排队使用POS机支付,耽误了时间也耽误了效率。这家公司在全国有近2000家门店,都在使用同一平台。尽管这家公司也在使用其他公司的运维管理平台,可对方并没有把这当做一回事;最要命的是,这家IT外包公司是国外的,正值夜晚,就算有了报警数据估计也没人注意到。

小小硬盘的缓存能引起大的事故,简直就是蝴蝶效应的现实版本。由此可见,一旦IT从传统的技术运维上升到业务运维,发挥的作用出乎意料,而这正是APM的未来所在。

要肯定传统APM的作用。无论是端到端的性能检测还是基于数据流程、系统流程的,都是属于IT自己的事情,和业务关系不大。APM的好处是,基于代码级别的,支持多平台和多语言,支持快速定位,具有全局的监控性能管理。如果这种技术以及思维方式扩大到更广泛的领域呢?

这就是如今的趋势,APM正在进入业务运维领域。这不是由厂商驱动的,而是业内趋势有关。这个趋势将改变APM产业格局,更会大大改变传统的业务运维。

前两天和云智慧的CEO殷晋先生、总裁刘洪涛先生交流之后,梳理出以下干货。

1. 企业的IT应用在发生变化,移动化、社交化对公司的商业模式、组织变革带来冲击,尤其是移动化。现在不少公司业务如销售线索发现、找到客户,完成支付和交易、甚至是数据的加工和汇总都在移动端完成。移动端的性能好坏直接影响到公司的核心业务,这是传统BPM无法解决的难题,上述是一个典型性的案例。

2. 需要转变APM的方向。APM的本意是应用性能监控,无论是提供代码级别的、跨平台的监控还是能迅速找到性能问题所在,都是IT的事情,和业务没有直接关系。这种IT和业务“两张皮”、自说自话的格局该转变了。比如说,代码写的不好,网络堵塞,APM能告诉我哪里出了问题,该如何解决。但它能告诉我,这种会影响到哪些业务,是供应链环节还是核心的交易系统,影响的程度如何?

3. 视角在发生转变。业务运维关注的是业务,是从用户的视角出发,关注点不同。这种业务的视角注定是解决业务问题,从数据的角度分析和关心业务的性能、关联度,促进交易,优化性能,提高用户留存率和活跃度,更好服务公司的主营业务。这种视角体现了IT的价值,更是IT与业务融合的具体表现形式,同时这种视角还具有全局性和逻辑性。

4. 业务运维有三个方面。分别是,IT支撑,这是APM的最擅长的领域,关注IT运维和IT基础设施监控,还要包括针对网络、应用端主动监控和应用性能管理;其次是业务系统,包括传统的ERP、交易系统、订单、支付系统、物流系统、供应链系统等,关注的是系统的稳定性,从数据的角度看业务的运营。最后是业务管理,关注的是企业内部人员、绩效问题的组织系统,包括业务流程、业务结果、业务效率和业务评价等;现在来说前两者都可以立刻实现,而业务管理部分还需要有相应的标准化体系建立。

5. 基于以上三个维度,可以构建三维立体模型,并根据业务指标与用户体验指标建立起基于业务质量的动态监控指标体系,形成相应的S-KPI、KQI,为业务运维提供科学的考评标准,这也是业务管理标准建立的基础。

6. 数据驱动的业务运维。这与市场主流的大数据分析公司的关注点不同。业务运维管理的核心是业务支撑系统的运行数据,自下而上把各个业务系统中的核心数据关联起来,再以自上而下的视角通过发现前端业务波动,找到造成问题的应用性能瓶颈,通过提高性能,为业务的高效运转做贡献。大数据厂商更注重用户数据的业务价值,关心各种数据的来源、转化率、流失率,强调的是运营层面的分析和优化结果,两者的应用范围不同、实现路径不同,方法论相似。

7. 业务运维已经进入应用阶段。这是企业发展的趋势,也是日后所有相关厂商的必争之地。云智慧最早开发出相关产品,并在多个领域有了成功案例,获得了先发优势。同时,在与传统企业客户的交流中,这种理念被客户广泛接受,云智慧再一次提早踏准了点。

8. 充分市场竞争环境下,体验是关键。云智慧通过在金融、商业、制造等竞争激烈行业近一年的客户交流和方案实施经验积累看到,从技术来说,业务运维管理和应用性能管理的原理相似,也没有太多难点和壁垒,几乎所有的APM厂商都能做。而客户更关心的是前端业务的“体验”,这是对业务产品关键影响的因素,也是业务运维的核心价值所在。

9. 需要行业共同努力。云智慧现在做的是在行业充当“布道师“,和用户探讨业务运维的转变方向、数据驱动的价值、业务的关注重点,以及和业务系统的融合。这个市场刚刚兴起,需要与企业CIO、经营层、管理层通过一系列普及概念和充分沟通,才能让业务运维切实发挥行业价值。

10. 单一功能的SaaS类产品价值在减少。APM的这种转变也是当前SaaS领域的发展趋势,只做单点应用、单一功能的工具类产品很难提升,企业客户需要切实解决某类业务问题的解决方案,而不仅仅是一个个IT工具。这是所有IT的核心价值所在,能为业务带来何种价值。只要有价值,就不会在经济形势不好的情况下被替换。

云智慧是业务运维解决方案服务商,旗下产品监控宝(www.jiankongbao.com)、透视宝(www.toushibao.com)、压测宝(www.yacebao.com),已累计为电商、移动互联网、广告传媒、在线游戏、教育医疗、金融证券、政企等行业的几十万用户提供了一站式的应用性能监控、管理及测试服务。

© 著作

不谈业务运维的IT主管早晚被淘汰 这里是10条干货的更多相关文章

  1. 美图秀秀DBA谈MySQL运维及优化

    美图秀秀DBA谈MySQL运维及优化 https://mp.weixin.qq.com/s?__biz=MzI4NTA1MDEwNg==&mid=401797597&idx=2& ...

  2. 什么是业务运维,企业如何实现互联网+业务与IT的融合

    业务运维并不是一个新概念,针对传统信息架构提出的业务服务管理就是把以业务为核心的IT系统与IT基础设施性能进行整合运维的解决方案.然而随着互联网+转型的不断推进,基础设施的智能化和广泛云化成为IT发展 ...

  3. Netflix业务运维分析和总结

    目录 Netflix工作环境的分析和思考 为什么Netflix会做得如此极致? 海量业务规模下的技术架构和挑战 更加合理的组织架构和先进的工具体系及理念 自由与责任并存的企业文化 当前问题: 精选提问 ...

  4. 浅谈SDN架构下的运维工作

    导读 目前国内的网络运维还处于初级阶段,工作人员每天就像救火一样,天天疲于奔命.运维人员只能埋头查找系统运行的日志,耗时耗力,老眼昏花不说,有时候忙了半天还一无所获,作为运维工程师的你,有木有遇到过类 ...

  5. 网络流量分析——NPMD关注IT运维、识别宕机和运行不佳进行性能优化。智能化分析是关键-主动发现业务运行异常。科来做APT相关的安全分析

    科来 做流量分析,同时也做了一些安全分析(偏APT)——参考其官网:http://www.colasoft.com.cn/cases-and-application/network-security- ...

  6. 《开源安全运维平台OSSIM最佳实践》

    <开源安全运维平台OSSIM最佳实践> 经多年潜心研究开源技术,历时三年创作的<开源安全运维平台OSSIM最佳实践>一书即将出版.该书用80多万字记录了,作者10多年的IT行业 ...

  7. IT Operations(IT 运营),运维的更价值化认识

    一直想努力向别人(甚至包括从事运维的人)解释清楚什么是运维,发现很难! 6月20号,在InfoQ高效运维群里面,对运维创业做了一次激烈的讨论,很自然地,过程中不可避免的谈到运维苦逼和运维无法产品化的问 ...

  8. linux 运维,代理,acl控制访问

    运维概述:运行 & 维护,Operation & MaintanceIT运维.业务运维.日常管理运维采用相关的方法.手段.技术.制度.流程和文档等,对IT运行环境.IT业务系统和IT运 ...

  9. 织云 Metis:看腾讯怎么做智能运维

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 作为企业智能运维门户,业界早已关注织云的智能运维体系.我们很荣幸地宣布织云 Metis 智能运维体系正式发布.自此,织云家族已发布:织云企业 ...

随机推荐

  1. python Queue模块

    先看一个很简单的例子 #coding:utf8 import Queue #queue是队列的意思 q=Queue.Queue(maxsize=10) #创建一个queue对象 for i in ra ...

  2. 如何将win7变为wifi热点

    以前经常使用connectify软件一键设置win7热点,但发现该软件影响开机速度,于是研究了一下win7自带的wifi功能,简单方便,分享如下: 1.打开命令提示符: [开始]/搜索框中输入“cmd ...

  3. EA中的模板管理

    EA在导出文档的时候可以选择各种模板. 使用系统提供的模板导出的文档会稍显繁杂.这时候就需要我们自定义模板. 1. 在导出文档的dialog, 在Template一项中选择 New Template. ...

  4. Calendar获取星期

    Calendar的使用举个小栗子: //通过当前时间获取本周周一时间 Date date = new Date(); Calendar calendar = new GregorianCalendar ...

  5. Valgrind 发现程序的内存问题

    参考 : [1]. 应用 Valgrind 发现 Linux 程序的内存问题. http://www.ibm.com/developerworks/cn/linux/l-cn-valgrind/ [2 ...

  6. Reactor模式通俗解释

    Reactor这个词译成汉语还真没有什么合适的,很多地方叫反应器模式,但更多好像就直接叫reactor模式了,其实我觉着叫应答者模式更好理解一些.通过了解,这个模式更像一个侍卫,一直在等待你的召唤,或 ...

  7. js 判断IOS版本号

    先来观察 iOS 的 User-Agent 串: Phone 4.3.2 系统:Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_2 like Mac OS X; e ...

  8. centos下ssh无密码验证

    #安装openssh-clients,rsync等#1.修改所有master和slave服务器的sshd_config,后面增加UseDNS noClientAliveInterval 30RSAAu ...

  9. ArcGIS api fo silverlight学习三(利用ElementLayer实现鼠标悬浮弹出自定义窗体)

    接着上一节继续学习,本节主要是利用ElementLayer实现鼠标悬浮弹出自定义窗体 参考博文:http://www.cnblogs.com/luxiaoxun/p/3322218.html 一.新建 ...

  10. SQL SERVER中求上月、本月和下月的第一天和最后一天 DATEADD DATEDIFF

    SQL SERVER中求上月.本月和下月的第一天和最后一天   1.上月的第一天 SELECT CONVERT(CHAR(10),DATEADD(month,-1,DATEADD(dd,-DAY(GE ...