Google Chrome 解决 “您的连接不是私密连接” 和被毒霸劫持 自己搭建了 k8s的 dashboard 结果 chrome 最新版本的打不开了.. 百度了下 园友的解决方案很完美 这里面转帖一下 进行学习.https://www.cnblogs.com/zhurong/p/9663566.html 增加内容:--test-type --ignore-certificate-errors 一.解决 “您的连接不是私密连接” 前一段时间,Chrome 突然显示出了“您的连接不是私密连接”…
引言:本文作者Ben Treynor Sloss,Google 运维团队的高级副总裁,SRE 名称的发明者,在这里提供了他对SRE 的定义.  本文选自<SRE:Google运维解密>. 大家都知道, 计算机软件系统离开人通常是无法自主运行的.那么,究竟应该如何去运维一个日趋复杂的大型分布式计算系统呢?雇佣系统管理员(sysadmin)运维复杂的计算机系统,是行业内一直以来的普遍做法.而Google 的解决之道是--SRE.  SRE 团队通过雇佣软件工程师,创造软件系统来维护系统运行以替代传…
How the production environment at Google fits together for networking, monitoring and finishing with a sample service architecture at Google. I am a Site Reliability Engineer at Google, annotating the SRE book in a series of posts. The opinions state…
A brief tour of some of the important components of a Google Datacenter.   A photo of the interior of a real Google Datacenter in North Carolina. Seen here are rows of racks containing machines. I am a Site Reliability Engineer at Google, annotating…
Google的Fergus Henderson在Software Engineering at Google中介绍了Google的软件工程实践. 软件开发 源码仓库 单一源代码仓库,除了核心配置和安全相关代码,任何工程师都可以访问任何代码,并可以根据需要修改 所有开发都基于master分支,发布的时候才创建发布分枝 代码的每个子树都有owner,任何修改都需要owner批准 Blaze分布式构建系统 构建和测试存储库中的任何软件通常非常简单和快捷 开发人员只需要编写BUILD文件,并且每个构建系…
1 规模效应 业务越庞大,服务器就越多,服务越多,就越需要拆分成分布式架构.架构越复杂,对运维的能力要求就越高.出错的概率就越大,运维的工作量就越大.因此就要更多开发提升效率的工具. 而在小企业,业务没有那么庞大,公司没有能力也不需要sre,只需要几个初级的linux系统管理员,做些手动的操作就可. 所以,sre在小企业是无法诞生的,因为没有起因. 2 SRE出身 2.1 做什么 软件工程师专注于软件系统的设计和实现. 需要另一个职业,专注于软件系统在整个生命周期中的保持稳定运行.发现问题,和软…
 SRE vs DevOps:是敌是友? - DockOne.io http://www.dockone.io/article/5935   RE vs DevOps:是敌是友? [编者的话]网站可靠性工程(SRE)和DevOps是两个具有相当多重叠的热门学科.在过去,一些人认为SRE是与DevOps相竞争的一组实践.但我们不认为他们有那么大差别.SRE是什么?它与DevOps有什么关系? 今年早些时候,我们(Liz Fong-Jones 和 Seth Vargo)发布了一组视频试图来回答这些问…
本文是一篇比较有价值的.介绍SRE的文章.国内的所谓SRE职责其实并不明确,大部分其实还是干普通运维的事.但文中介绍的谷歌的运作方式起点还是相对比较高的,无论对SRE.对开发,甚至对公司都有很高的要求.正如本文所述,谷歌的方式并不一定适合其他公司,但其SRE的建设经验仍然能够带来一定的启发.在阅读本文的时候,我是比较好奇谷歌是如何解决SRE和开发相互推诿的问题的. 译自:How Google SRE And Developers Collaborate 谷歌的SRE是一个专业的工程师组织,致力于…
本文是 Uber 的工程师 Gergely Orosz 的文章,原文地址在:https://blog.pragmaticengineer.com/operating-a-high-scale-distributed-system/ 在过去的几年里,我一直在构建和运营一个大型分布式系统:优步的支付系统.在此期间,我学到了很多关于分布式架构概念的知识,并亲眼目睹了高负载和高可用性系统运行的挑战(一个系统远远不是开发完了就完了,线上运行的挑战实际更大).构建系统本身是一项有趣的工作.规划系统如何处理1…
CI Weekly 围绕『 软件工程效率提升』 进行一系列技术内容分享,包括国内外持续集成.持续交付,持续部署.自动化测试. DevOps 等实践教程.工具与资源,以及一些工程师文化相关的程序员 Tips .同步于 flow.ci Blog.微信公众号.官方微博,知乎专栏,简书,欢迎关注或投稿:) 上周,我们对 flow.ci 做了比较多的功能优化: 1.iOS 项目持续集成 iOS 项目支持 Carthage 依赖管理: 去除 iOS 项目中自动管理证书设置,防止 Xcode8 编译失: 解决…