子曰“干的最好就是个60分,稍有纰漏就是不及格”

谈一个事情,最先要谈的就是统一标准,又或者这个标准已经约定俗成,广泛认可,所以就可以略过。对于IT服务质量来说,确实有一个统一的标准,那就是上面的那个子曰:“干的最好就是个60分,稍有纰漏就是不及格”。可悲的是虽然无论基层技术人员、中层管理人员、高层管理人员,甚至是旁观者来说,都不觉得这个标准是非常合理的,但是在实践当中,大家又都不自觉的执行着这个标准。真是有够虐心的。

有一些高速发展的中小型互联网企业,为了保证技术团队的积极性,对运维事故表现出很高的宽容度。但是,这不代表老板心中没有看法,所以实际上标准还是那个“子曰”。

在这种畸形标准的制约下,很多企业(特别是有钱企业)的IT服务管理走向了一条为了表现“已管理”,而进行管理的邪路。其本质原因是,在运维过程中,事故是难以完全避免和杜绝的。但领导的期望又是杜绝事故,那对于中层管理人员和基层技术人员来说,唯一能做的就是让领导相信,“我们把能想到的都做了,再出事那就是天灾人祸”。

说这个问题以前,我想先拿传统企业来做对比。传统企业比较典型的有产品开发部门、生产部门、市场和宣传部门、销售部门、售后维护部门,还有其他一些保证企业运行或发展的平台部门。对于一个以信息化(网上、手机上)服务作为主要业务提供模式的企业来说,和传统企业相关部门的对应关系是,软件开发部门对应到产品开发部,市场宣传部门和销售部门几乎没变(可能营销方式不同),售后部门基本没变,平台部门基本也没变,那么IT运维部实际对应的是传统企业的生产部门。想通这个问题很重要,因为实际上许多企业仍然按照传统的模式,把IT运维部门对应到平台的某个部门当中。平台部门是纯粹的成本部门,做的事情单一、重复率高,自然不允许犯错。但是,如果是生产部门,则另当别论,生产部门需要面临不同的原材料(IT运维往往要面临不同的数据和有缺陷的软件),承担巨大的生产压力,其实高层管理者,往往喜欢用成本利润的方式来考核生产部门。不出事不是最重要的,关键是事故可控,以及控制事故的成本低于所能获得的利润。

有了这个对比就清晰多了,即然IT运维部门对于一个企业来说是生产部门,那么管理者更应该关注的是能接受的IT服务质量和成本是什么,以及哪种类型(或严重程度)的事故是不能接受的。我曾经接触过一个客户,他们列出了不能接受的几类事故(例如:大量数据丢失、安全泄密、长时间故障不能恢复等),同时列出了能接受的服务质量(例如:可用率指标、服务响应时间指标、故障响应时间指标、知识管理指标等)。这种比较清晰的、可量化的指标体系,可以保证IT服务管理有的放矢。那么基于这些指标,IT服务管理者就可以选择合适的流程和工具,保证关键和重要指标的满足,同时也可以考虑节约成本的方法和途径。同时,也能避免“干的最好就是个60分,稍有纰漏就是不及格”。只要指标满足了,就是个100分。没满足,那么可以根据指标的权重计算分值,当然了出了不可接受的事故,就是不及格。

没有规矩不成方圆,我强烈建议,任何一个准备提升IT服务质量的企业,先根据自身的业务需求,列出(或回顾)完整的IT服务指标。同时,这些指标也可以作为SLA(Service-Level Agreement)管理的基础。

IT服务(运维)管理实施的几个要点--第一章 IT服务质量的标准的更多相关文章

  1. IT服务(运维)管理实施的几个要点--第二章 人员和组织架构

    子曰"没有合适的人" 在流程化的管理模式下,最容易步入的一个误区是按流程设计一个"理想的"组织架构,然后对应于这个架构对人员进行评估.培养,甚至是更换.我见过很 ...

  2. IT服务(运维)管理实施的几个要点--序言

    IT服务(运维)管理(不是IT运维技术)是IT行业当中相对比较"窄"的一个分支,通常只被金融.电信等大型数据中心的中高层管理人员所关注.但是根据笔者多年从事IT服务和服务管理的经验 ...

  3. 《Ansible自动化运维:技术与佳实践》第一章读书笔记

    Ansible 架构及特点 第一章主要讲的是 Ansible 架构及特点,主要包含以下内容: Ansible 软件 Ansible 架构模式 Ansible 特性 Ansible 软件 Ansible ...

  4. 企业该如何进行高效IT运维管理

    企业该如何进行高效IT运维管理 在企业内部也是一样,当大量的生产和经营数据集中在数据中心,一旦人们与数据中心因为IT故障而失去联系,停滞的也许不是个人应用受阻这样简单的后果.我们谁也不想看到自己企业的 ...

  5. ylbtech-KeFuYunWei(服务运维考核系统)-数据库设计

    ylbtech-DatabaseDesgin:ylbtech-KeFuYunWei(服务运维考核系统)-数据库设计 DatabaseName:KEFUYUNWEI Model:Admin 用户后台管理 ...

  6. 系统批量运维管理器Fabric详解

    系统批量运维管理器Fabric详解 Fabrici 是基于python现实的SSH命令行工具,简化了SSH的应用程序部署及系统管理任务,它提供了系统基础的操作组件,可以实现本地或远程shell命令,包 ...

  7. 不吹不黑,赞一下应用运维管理的cassacdra

    不吹不黑的为菊厂的应用运维管理AOM点个赞.Why? 某菊厂应用运维管理工具AOM每天处理着亿级条数据,这么多数据是怎么存储的呢? 说到数据存储就会想到关系型数据库,比如mysql,oracle,sy ...

  8. Linux运维入门到高级全套常用要点

    Linux运维入门到高级全套常用要点 目 录 1. Linux 入门篇................................................................. ...

  9. 15-MySQL DBA笔记-运维管理

    第15章 运维管理 随着各种技术的快速发展,现今的DBA可以比以前的DBA维护多得多的数据库实例.DBA已经越来越像一个资源的管理者,而不是简单的操作步骤执行人.本章将为读者介绍规模化运维之道.首先, ...

随机推荐

  1. memcached一致性哈希及php客户端实现

    1.memcached分布式算法 memcached的分布式是依靠客户端的算法来实现,假设键名为$key,服务器数量为N,常规的实现方式有两种: 取模哈希 crc32($key)%N,通过这个算法将键 ...

  2. JSP8

     一.EL表达式 JSP表达式语言(EL)使得访问存储在JavaBean中的数据变得非常简单.JSP EL既可以用来创建算术表达式也可以用来创建逻辑表达式.在JSP EL表达式内可以使用整型数,浮点数 ...

  3. 进程互斥(锁)------------------>一个坑

    进程互斥锁 引入: 进程之间数据不共享,但是共享同一套文件系统(如硬盘.键盘.cpu等),所以访问同一个文件,或同一个打印终端,是没有问题的,竞争带来的结果就是错乱,如何控制,就是加锁处理,即进程加锁 ...

  4. PHPstorm 如何新增项目

    如何在PHPstorm新增项目 1.打开设置 2.找到Directories ,点击增加路径

  5. ASP.NET没有魔法——ASP.NET MVC使用Oauth2.0实现身份验证

    随着软件的不断发展,出现了更多的身份验证使用场景,除了典型的服务器与客户端之间的身份验证外还有,如服务与服务之间的(如微服务架构).服务器与多种客户端的(如PC.移动.Web等),甚至还有需要以服务的 ...

  6. Ansible - 简介和应用自动化基础实践

    installAnsible简介和应用自动化基础实践 一.引入: 1.1  如官方定义,Ansible is The simplest way to automate apps and IT infr ...

  7. Ubuntu下安装Anaconda和tensorflow

    官方指南:https://github.com/tensorflow/tensorflow/blob/master/tensorflow/docs_src/install/install_linux. ...

  8. 怎样解决jsp:include标签在包括html文件时遇到的乱码问题

    在一个JSP页面中,经常须要包括还有一个文件,JSP为我们提供了jsp:include标签能够完毕这个功能,比方:<jsp:include page="some.jsp"&g ...

  9. Spring基础知识之基于注解的AOP

    背景概念: 1)横切关注点:散布在应用中多处的功能称为横切关注点 2)通知(Advice):切面完成的工作.通知定了了切面是什么及何时调用. 5中可以应用的通知: 前置通知(Before):在目标方法 ...

  10. JAVA入门[18]-JdbcTemplate简单实例

    一.关于JdbcTemplate JdbcTemplate是最基本的Spring JDBC模板,这个模板支持简单的JDBC数据库访问功能以及基于索引参数的查询. Spring数据访问模板:在数据库操作 ...