IT服务(运维)管理实施的几个要点--第一章 IT服务质量的标准
子曰“干的最好就是个60分,稍有纰漏就是不及格”
谈一个事情,最先要谈的就是统一标准,又或者这个标准已经约定俗成,广泛认可,所以就可以略过。对于IT服务质量来说,确实有一个统一的标准,那就是上面的那个子曰:“干的最好就是个60分,稍有纰漏就是不及格”。可悲的是虽然无论基层技术人员、中层管理人员、高层管理人员,甚至是旁观者来说,都不觉得这个标准是非常合理的,但是在实践当中,大家又都不自觉的执行着这个标准。真是有够虐心的。
有一些高速发展的中小型互联网企业,为了保证技术团队的积极性,对运维事故表现出很高的宽容度。但是,这不代表老板心中没有看法,所以实际上标准还是那个“子曰”。
在这种畸形标准的制约下,很多企业(特别是有钱企业)的IT服务管理走向了一条为了表现“已管理”,而进行管理的邪路。其本质原因是,在运维过程中,事故是难以完全避免和杜绝的。但领导的期望又是杜绝事故,那对于中层管理人员和基层技术人员来说,唯一能做的就是让领导相信,“我们把能想到的都做了,再出事那就是天灾人祸”。
说这个问题以前,我想先拿传统企业来做对比。传统企业比较典型的有产品开发部门、生产部门、市场和宣传部门、销售部门、售后维护部门,还有其他一些保证企业运行或发展的平台部门。对于一个以信息化(网上、手机上)服务作为主要业务提供模式的企业来说,和传统企业相关部门的对应关系是,软件开发部门对应到产品开发部,市场宣传部门和销售部门几乎没变(可能营销方式不同),售后部门基本没变,平台部门基本也没变,那么IT运维部实际对应的是传统企业的生产部门。想通这个问题很重要,因为实际上许多企业仍然按照传统的模式,把IT运维部门对应到平台的某个部门当中。平台部门是纯粹的成本部门,做的事情单一、重复率高,自然不允许犯错。但是,如果是生产部门,则另当别论,生产部门需要面临不同的原材料(IT运维往往要面临不同的数据和有缺陷的软件),承担巨大的生产压力,其实高层管理者,往往喜欢用成本利润的方式来考核生产部门。不出事不是最重要的,关键是事故可控,以及控制事故的成本低于所能获得的利润。
有了这个对比就清晰多了,即然IT运维部门对于一个企业来说是生产部门,那么管理者更应该关注的是能接受的IT服务质量和成本是什么,以及哪种类型(或严重程度)的事故是不能接受的。我曾经接触过一个客户,他们列出了不能接受的几类事故(例如:大量数据丢失、安全泄密、长时间故障不能恢复等),同时列出了能接受的服务质量(例如:可用率指标、服务响应时间指标、故障响应时间指标、知识管理指标等)。这种比较清晰的、可量化的指标体系,可以保证IT服务管理有的放矢。那么基于这些指标,IT服务管理者就可以选择合适的流程和工具,保证关键和重要指标的满足,同时也可以考虑节约成本的方法和途径。同时,也能避免“干的最好就是个60分,稍有纰漏就是不及格”。只要指标满足了,就是个100分。没满足,那么可以根据指标的权重计算分值,当然了出了不可接受的事故,就是不及格。
没有规矩不成方圆,我强烈建议,任何一个准备提升IT服务质量的企业,先根据自身的业务需求,列出(或回顾)完整的IT服务指标。同时,这些指标也可以作为SLA(Service-Level Agreement)管理的基础。
IT服务(运维)管理实施的几个要点--第一章 IT服务质量的标准的更多相关文章
- IT服务(运维)管理实施的几个要点--第二章 人员和组织架构
子曰"没有合适的人" 在流程化的管理模式下,最容易步入的一个误区是按流程设计一个"理想的"组织架构,然后对应于这个架构对人员进行评估.培养,甚至是更换.我见过很 ...
- IT服务(运维)管理实施的几个要点--序言
IT服务(运维)管理(不是IT运维技术)是IT行业当中相对比较"窄"的一个分支,通常只被金融.电信等大型数据中心的中高层管理人员所关注.但是根据笔者多年从事IT服务和服务管理的经验 ...
- 《Ansible自动化运维:技术与佳实践》第一章读书笔记
Ansible 架构及特点 第一章主要讲的是 Ansible 架构及特点,主要包含以下内容: Ansible 软件 Ansible 架构模式 Ansible 特性 Ansible 软件 Ansible ...
- 企业该如何进行高效IT运维管理
企业该如何进行高效IT运维管理 在企业内部也是一样,当大量的生产和经营数据集中在数据中心,一旦人们与数据中心因为IT故障而失去联系,停滞的也许不是个人应用受阻这样简单的后果.我们谁也不想看到自己企业的 ...
- ylbtech-KeFuYunWei(服务运维考核系统)-数据库设计
ylbtech-DatabaseDesgin:ylbtech-KeFuYunWei(服务运维考核系统)-数据库设计 DatabaseName:KEFUYUNWEI Model:Admin 用户后台管理 ...
- 系统批量运维管理器Fabric详解
系统批量运维管理器Fabric详解 Fabrici 是基于python现实的SSH命令行工具,简化了SSH的应用程序部署及系统管理任务,它提供了系统基础的操作组件,可以实现本地或远程shell命令,包 ...
- 不吹不黑,赞一下应用运维管理的cassacdra
不吹不黑的为菊厂的应用运维管理AOM点个赞.Why? 某菊厂应用运维管理工具AOM每天处理着亿级条数据,这么多数据是怎么存储的呢? 说到数据存储就会想到关系型数据库,比如mysql,oracle,sy ...
- Linux运维入门到高级全套常用要点
Linux运维入门到高级全套常用要点 目 录 1. Linux 入门篇................................................................. ...
- 15-MySQL DBA笔记-运维管理
第15章 运维管理 随着各种技术的快速发展,现今的DBA可以比以前的DBA维护多得多的数据库实例.DBA已经越来越像一个资源的管理者,而不是简单的操作步骤执行人.本章将为读者介绍规模化运维之道.首先, ...
随机推荐
- 使用sklearn进行数据挖掘-房价预测(3)—绘制数据的分布
使用sklearn进行数据挖掘系列文章: 1.使用sklearn进行数据挖掘-房价预测(1) 2.使用sklearn进行数据挖掘-房价预测(2)-划分测试集 3.使用sklearn进行数据挖掘-房价预 ...
- 中介者模式(Mediator)
中介者模式(Mediator) 中介者模式也是用来降低类类之间的耦合的,因为如果类类之间有依赖关系的话,不利于功能的拓展和维护,因为只要修改一个对象,其它关联的对象都得进行修改.如果使用中介者模式,只 ...
- 树莓派搭建pptp---vpn
好久没写博文了啊,这次好好写 先普及下知识啊 PTP(Point to Point Tunneling Protocol),即点对点隧道协议.该协议是在PPP协议的基础上开发的一种新的增强型安全协议, ...
- Android 跨进程启动Activity黑屏(白屏)的三种解决方案
原文链接:http://www.cnblogs.com/feidu/p/8057012.html 当Android跨进程启动Activity时,过程界面很黑屏(白屏)短暂时间(几百毫秒?).当然从桌面 ...
- C++ list forward_list
list,forward_list list:双向链表 forward_list:单向链表 在任何位置添加元素,删除元素都很快,但随机访问元素则很慢 声明和初始化 list<T> l; l ...
- 使用背景图修改radio、checkbox样式
如果觉得设置样式太麻烦,或者页面上选中的样式太复杂,也可以用背景图去修改样式<div class=""> <label><input type=&qu ...
- ChromeExtension那些事儿
Chrome Extension是什么呢? 简而言之,就是Chrome扩展,它是基于Chrome浏览器的,我们可以理解它为一个独立运行在Chrome浏览器下的APP,当然核心编程语言就是JavaScr ...
- 使用AOP记录应用调用链开销
最近系统出现了一次线上的性能问题,本来以为目前的QPS应该是不会出现任何问题的,结果微服务还是比较容易因为某个点的问题导致雪崩的...出了性能问题就要做分析,正统的思路是要不断进行压测用JProfil ...
- Java-----SSM(SpringMVC+Spring+mybaties)框架整合
在进行整合之前,首先了解这个框架的作用 Mybaties: 丰富的标签库,可写动态sql,并统一的在.XML文件中编写,方便统一管理,解耦 SpringMVC: 标准的MVC思想(mode,view, ...
- 最全面的JS表单验证
两个日期比較 /* 用途:检查開始日期是否小于等于结束日期 输入: s:字符串 開始日期 格式:2001-5-4 e:字符串 结束日期 格式:2002-5-4 返回: 假设通过開始日期小于等于结 ...