大数网 吴玉征

先说个真实的故事。

前一段时间,有一家知名的国际连锁咖啡公司的自助交易系统(支付宝、微信、ApplePAY)特别慢,工作人员也不知道为什么。由于他们刚上了业务运维,支持这套系统的云智慧后台管理人员通过数据一层层梳理,最后确定到某个区域的某个数据中心的某一块硬盘缓存溢满,导致交易变慢。找到并解决问题之后,该咖啡连锁店一下午挽回好几万笔的交易数。

为什么这么大量?因为一旦手机支付存在问题,大量用户排队使用POS机支付,耽误了时间也耽误了效率。这家公司在全国有近2000家门店,都在使用同一平台。尽管这家公司也在使用其他公司的运维管理平台,可对方并没有把这当做一回事;最要命的是,这家IT外包公司是国外的,正值夜晚,就算有了报警数据估计也没人注意到。

小小硬盘的缓存能引起大的事故,简直就是蝴蝶效应的现实版本。由此可见,一旦IT从传统的技术运维上升到业务运维,发挥的作用出乎意料,而这正是APM的未来所在。

要肯定传统APM的作用。无论是端到端的性能检测还是基于数据流程、系统流程的,都是属于IT自己的事情,和业务关系不大。APM的好处是,基于代码级别的,支持多平台和多语言,支持快速定位,具有全局的监控性能管理。如果这种技术以及思维方式扩大到更广泛的领域呢?

这就是如今的趋势,APM正在进入业务运维领域。这不是由厂商驱动的,而是业内趋势有关。这个趋势将改变APM产业格局,更会大大改变传统的业务运维。

前两天和云智慧的CEO殷晋先生、总裁刘洪涛先生交流之后,梳理出以下干货。

1. 企业的IT应用在发生变化,移动化、社交化对公司的商业模式、组织变革带来冲击,尤其是移动化。现在不少公司业务如销售线索发现、找到客户,完成支付和交易、甚至是数据的加工和汇总都在移动端完成。移动端的性能好坏直接影响到公司的核心业务,这是传统BPM无法解决的难题,上述是一个典型性的案例。

2. 需要转变APM的方向。APM的本意是应用性能监控,无论是提供代码级别的、跨平台的监控还是能迅速找到性能问题所在,都是IT的事情,和业务没有直接关系。这种IT和业务“两张皮”、自说自话的格局该转变了。比如说,代码写的不好,网络堵塞,APM能告诉我哪里出了问题,该如何解决。但它能告诉我,这种会影响到哪些业务,是供应链环节还是核心的交易系统,影响的程度如何?

3. 视角在发生转变。业务运维关注的是业务,是从用户的视角出发,关注点不同。这种业务的视角注定是解决业务问题,从数据的角度分析和关心业务的性能、关联度,促进交易,优化性能,提高用户留存率和活跃度,更好服务公司的主营业务。这种视角体现了IT的价值,更是IT与业务融合的具体表现形式,同时这种视角还具有全局性和逻辑性。

4. 业务运维有三个方面。分别是,IT支撑,这是APM的最擅长的领域,关注IT运维和IT基础设施监控,还要包括针对网络、应用端主动监控和应用性能管理;其次是业务系统,包括传统的ERP、交易系统、订单、支付系统、物流系统、供应链系统等,关注的是系统的稳定性,从数据的角度看业务的运营。最后是业务管理,关注的是企业内部人员、绩效问题的组织系统,包括业务流程、业务结果、业务效率和业务评价等;现在来说前两者都可以立刻实现,而业务管理部分还需要有相应的标准化体系建立。

5. 基于以上三个维度,可以构建三维立体模型,并根据业务指标与用户体验指标建立起基于业务质量的动态监控指标体系,形成相应的S-KPI、KQI,为业务运维提供科学的考评标准,这也是业务管理标准建立的基础。

6. 数据驱动的业务运维。这与市场主流的大数据分析公司的关注点不同。业务运维管理的核心是业务支撑系统的运行数据,自下而上把各个业务系统中的核心数据关联起来,再以自上而下的视角通过发现前端业务波动,找到造成问题的应用性能瓶颈,通过提高性能,为业务的高效运转做贡献。大数据厂商更注重用户数据的业务价值,关心各种数据的来源、转化率、流失率,强调的是运营层面的分析和优化结果,两者的应用范围不同、实现路径不同,方法论相似。

7. 业务运维已经进入应用阶段。这是企业发展的趋势,也是日后所有相关厂商的必争之地。云智慧最早开发出相关产品,并在多个领域有了成功案例,获得了先发优势。同时,在与传统企业客户的交流中,这种理念被客户广泛接受,云智慧再一次提早踏准了点。

8. 充分市场竞争环境下,体验是关键。云智慧通过在金融、商业、制造等竞争激烈行业近一年的客户交流和方案实施经验积累看到,从技术来说,业务运维管理和应用性能管理的原理相似,也没有太多难点和壁垒,几乎所有的APM厂商都能做。而客户更关心的是前端业务的“体验”,这是对业务产品关键影响的因素,也是业务运维的核心价值所在。

9. 需要行业共同努力。云智慧现在做的是在行业充当“布道师“,和用户探讨业务运维的转变方向、数据驱动的价值、业务的关注重点,以及和业务系统的融合。这个市场刚刚兴起,需要与企业CIO、经营层、管理层通过一系列普及概念和充分沟通,才能让业务运维切实发挥行业价值。

10. 单一功能的SaaS类产品价值在减少。APM的这种转变也是当前SaaS领域的发展趋势,只做单点应用、单一功能的工具类产品很难提升,企业客户需要切实解决某类业务问题的解决方案,而不仅仅是一个个IT工具。这是所有IT的核心价值所在,能为业务带来何种价值。只要有价值,就不会在经济形势不好的情况下被替换。

云智慧是业务运维解决方案服务商,旗下产品监控宝(www.jiankongbao.com)、透视宝(www.toushibao.com)、压测宝(www.yacebao.com),已累计为电商、移动互联网、广告传媒、在线游戏、教育医疗、金融证券、政企等行业的几十万用户提供了一站式的应用性能监控、管理及测试服务。

© 著作

不谈业务运维的IT主管早晚被淘汰 这里是10条干货的更多相关文章

  1. 美图秀秀DBA谈MySQL运维及优化

    美图秀秀DBA谈MySQL运维及优化 https://mp.weixin.qq.com/s?__biz=MzI4NTA1MDEwNg==&mid=401797597&idx=2& ...

  2. 什么是业务运维,企业如何实现互联网+业务与IT的融合

    业务运维并不是一个新概念,针对传统信息架构提出的业务服务管理就是把以业务为核心的IT系统与IT基础设施性能进行整合运维的解决方案.然而随着互联网+转型的不断推进,基础设施的智能化和广泛云化成为IT发展 ...

  3. Netflix业务运维分析和总结

    目录 Netflix工作环境的分析和思考 为什么Netflix会做得如此极致? 海量业务规模下的技术架构和挑战 更加合理的组织架构和先进的工具体系及理念 自由与责任并存的企业文化 当前问题: 精选提问 ...

  4. 浅谈SDN架构下的运维工作

    导读 目前国内的网络运维还处于初级阶段,工作人员每天就像救火一样,天天疲于奔命.运维人员只能埋头查找系统运行的日志,耗时耗力,老眼昏花不说,有时候忙了半天还一无所获,作为运维工程师的你,有木有遇到过类 ...

  5. 网络流量分析——NPMD关注IT运维、识别宕机和运行不佳进行性能优化。智能化分析是关键-主动发现业务运行异常。科来做APT相关的安全分析

    科来 做流量分析,同时也做了一些安全分析(偏APT)——参考其官网:http://www.colasoft.com.cn/cases-and-application/network-security- ...

  6. 《开源安全运维平台OSSIM最佳实践》

    <开源安全运维平台OSSIM最佳实践> 经多年潜心研究开源技术,历时三年创作的<开源安全运维平台OSSIM最佳实践>一书即将出版.该书用80多万字记录了,作者10多年的IT行业 ...

  7. IT Operations(IT 运营),运维的更价值化认识

    一直想努力向别人(甚至包括从事运维的人)解释清楚什么是运维,发现很难! 6月20号,在InfoQ高效运维群里面,对运维创业做了一次激烈的讨论,很自然地,过程中不可避免的谈到运维苦逼和运维无法产品化的问 ...

  8. linux 运维,代理,acl控制访问

    运维概述:运行 & 维护,Operation & MaintanceIT运维.业务运维.日常管理运维采用相关的方法.手段.技术.制度.流程和文档等,对IT运行环境.IT业务系统和IT运 ...

  9. 织云 Metis:看腾讯怎么做智能运维

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 作为企业智能运维门户,业界早已关注织云的智能运维体系.我们很荣幸地宣布织云 Metis 智能运维体系正式发布.自此,织云家族已发布:织云企业 ...

随机推荐

  1. Django 之 查看执行的sql语句

    前提: 我的app名称为core,models.py内容如下: # coding:utf-8 from django.db import models # Create your models her ...

  2. 【OpenCV】视频取坐标

    今天实现了视频播放以后暂停获取鼠标点击处坐标的功能. #include <iostream> #include <opencv2/highgui/highgui.hpp> #i ...

  3. DELL PowerEdge 2950更换告警硬盘

    硬盘为SAS300G15K,四块,3#告警,打算还掉,在R900上找到一块对应的硬盘直接换下. 进入控制台后发现硬盘阵列里还是只有三块硬盘,物理磁盘倒是有四块,新插上的一块状态为“外部”,其他状态是“ ...

  4. js 取得 Unix时间戳(Unix timestamp)

    js 取得 Unix时间戳 Unix时间戳(Unix timestamp),或称Unix时间(Unix time).POSIX时间(POSIX time),是一种时间表示方式,定义为从格林威治时间19 ...

  5. LinkedList详细分析

    一.源码解析1. LinkedList类定义2.LinkedList数据结构原理3.私有属性4.构造方法5.元素添加add()及原理6.删除数据remove()7.数据获取get()8.数据复制clo ...

  6. 字典树的C++实现

    此次代码使用了诸多新鲜玩意,比如自动类型推断,模板类等等,感觉真的超级好玩啊. 自己做了一个简易的测试,程序的健壮性什么的还是比较差的,此程序留待以后进行功能补全. #pragma once #inc ...

  7. BZOJ 3732 Network

    2016.1.28 纪念我BZOJ第一题 Description 给你N个点的无向图 (1 <= N <= 15,000),记为:1…N. 图中有M条边 (1 <= M <= ...

  8. [JavaScript]配置日期选择控件

    我选择的日期控件是:bootstrap-datepicker(下载路径:https://github.com/Aymkdn/Datepicker-for-Bootstrap) 比较方便,实用.原来是英 ...

  9. Windows Linux 之间rsync同步CODE文件

    Windows Linux 之间rsync同步CODE文件 一.环境Windows:OS:Microsoft Windows Web Server 2008 SP1IP:192.168.88.197 ...

  10. 剑指Offer:解决难题时的三大方法

    1.画图 让抽象的东西变得直观生动起来.比如设计二叉树,链表,栈,队列这些数据结构时. 2.举例子 同样可以化抽象为直观.能够更清晰的展现思路.从例子归纳出一般做法. 3.分解 有时问题本身是比较复杂 ...