SRE方法论之拥抱风险】的更多相关文章

写在前面 最近花了一点时间阅读了<SRE Goolge运维解密>这本书,对于书的内容大家可以看看豆瓣上的介绍.总体而言,这本书是首次比较系统的披露Google内部SRE运作的一些指导思想.实践以及相关的问题,对于我们运维乃至开发人员都有一定的借鉴意义. 书中的一些思想也令我印象深刻,例如SRE工程师要保证投入50%的时间在项目上.错误预算.命运之轮.事故总结等等,对于从业者有很大的启发.书中提到了很多思想,也提到了很多工具,我想不同的单位有不同的文化.制度背景,这种指导思想未必能够执行,但是书…
虎牙直播运维负责人张观石 本文是根据虎牙直播运维负责人张观石10月20日在msup携手魅族.Flyme.百度云主办的第十三期魅族开放日<虎牙直播平台SRE实践>演讲中的分享内容整理而成. 张观石,拥有10余年网站开发.架构.运维经验:目前关注互联网服务可靠性系统工程.运维平台的规划建设.网站高可用架构等方面:在音视频传输质量评估.微服务运维方面积累了丰富的经验. 目录 一. 直播平台的架构及运维挑战 (一) 音视频传输流程及挑战 (二) 一个直播间的流程 (三) 直播平台的运维挑战 二. 我们…
注:这是去年国庆时的一篇读书笔记,最近线上故障频繁,重新读了下这篇读书笔记,觉得<Google SRE>非常棒,遂从简书再搬家到博客园,希望大家受益.我的简书地址:daoqidelv 国庆长假,出门太堵,遂待在魔都,花了三天时间将<Google SRE>中文版翻了一遍,好书一本,不管是开发人员.运维人员还是架构师,都可以读一读,受益匪浅的. 鉴于自己是做开发的,所以对于运维相关流程化的内容没有涉猎.不过这部分内容对于运维leader应当是大有裨益的. SRE是个全能手,DevOps…
引言:本文作者Ben Treynor Sloss,Google 运维团队的高级副总裁,SRE 名称的发明者,在这里提供了他对SRE 的定义.  本文选自<SRE:Google运维解密>. 大家都知道, 计算机软件系统离开人通常是无法自主运行的.那么,究竟应该如何去运维一个日趋复杂的大型分布式计算系统呢?雇佣系统管理员(sysadmin)运维复杂的计算机系统,是行业内一直以来的普遍做法.而Google 的解决之道是--SRE.  SRE 团队通过雇佣软件工程师,创造软件系统来维护系统运行以替代传…
1. 项目管理简介 (1) 项目管理定义 项目管理定义 : 将 知识, 技能, 工具 与 技术 应用与项目活动, 以满足项目的要求; (2) 现代项目管理 现代项目管理与传统项目管理区别 : -- 传统项目管理 (风险) : 只关心 项目计划 和 项目实施, 很少考虑 风险; -- 现代项目管理 (风险, 内涵) : 现代项目管理则强调对项目目标的 主动控制, 对项目实现过程中遭遇的 风险和干扰因素防防患与未然, 以避免和减少损失, 现代项目管理的内涵已经扩展到了 项目前期 和 项目后期; 现代…
好紧张, 3月28考试, 全力学 PMP ~~ 一. 项目 1. 项目的定义 项目 : 项目是为创造 独特 的 产品, 服务 或 成果 而进行的 临时性 工作; -- 独特 : 独特性是项目的特征, 每个项目都有不同之处; -- 临时性 : 一个项目必有起点 和 终点, 不会一直维持下去; -- 项目产物 : 类型多种多样, 包括但不限于 产品 服务 成果; 2. 项目的特征 (1) 临时性 项目临时性简介 : 项目有明确的 起点 和 终点; -- 项目结束标志 : 项目目标达成, 无法达成目标…
9 月 19 日,CODING 和中国 DevOps 社区联合举办的深圳第九届 Meetup 在腾讯大厦 2 楼多功能圆满结束.本次沙龙以 「DevOps 转型与实践」 为主题,4 位来自互联网.金融.零售行业的知名世界 500 强企业技术大咖,在现场分享了他们对于 DevOps 转型实践的见解和经验.80 多位观众与讲师们也进行了深入的技术探讨,共同探讨在 DevOps 潮流下,企业可能面临的新机遇和挑战. CODING 一直致力于让所有开发者都能有机会倾听最具前沿的 DevOps 技术分享,…
最近几年,由于负责的范围的变化.工作逐渐从某个IT领域或者部门,开始关注到整个IT体系的运转和管理.中间也遇到不少困难,同时也有机会去从更高的层面去学习和实践IT治理.文章主要是总结一下我对DevOps相关的理解和认识. 为什么会有DevOps,解决了什么问题: 现代企业其实都是通过IT系统进行管理和运营的,在变化迅速和竞争激烈的领域,IT系统的新需求数量越来越多,软件发布的频率越来越高,不少互联网公司24小时内会发布几十个到上百个release到生产环境.与此同时,业务对IT服务和系统的稳定性…
目录 一.误区 二.DevOps 和 SRE 定义 三.两者产生背景和历史 四.两者的职能不同 五.工作内容不同 六.DevOps 和 SRE 关系 七.附录:技能点 DevOps SRE 一.误区 最近有一位朋友和我聊职业发展方向问题,聊了不少 DevOps 和 SRE 话题. 我几年前刚接触这两个概念时也常常将之混淆,可惜当时没有人来解答我困惑. 现在这虽然已经极为流行,但是我发现我这位朋友对这两个职位还存在一些误区. 于是我给了一些见解并整理成文章以饕大众. 最常见的误区: DevOps…
最近上了PMP课程,感觉受益匪浅,思路有被打开. 很同意一个观点“国人很擅长做事,但是不擅长总结出解决问题的通用框架和方法论”. 为了能提高中小企业生产力我最近成了一个小的软件咨询公司取名“惟思捷”,取惟有“思考”和“敏捷”之意. 我觉得一个项目/组织需要做成功可以参照或考虑我提出的ReDoIt方法论,也希望有更多的人支持和丰富我的观点: Rule(规矩),Energetic(精力旺盛),Detail(细节),Open(开放), Iteration(迭代),Transparent(透明),ReD…