DevOps |研发效能之环境、程序、配置、SQL变更管理
本文主要是讲如何建立有效的环境、程序、配置、SQL变更和管理平台。
几天前和一个朋友聊到环境、程序的配置变更,SQL变更和整个上线流程。之前我们在这块也做了很多,有做的好的也有做的一般的,借机都总结下来,希望对你有用。
通常情况下,我们最关注的也是最重要的部分是应用的变更,就是程序的部署上线发布这块,因为这部分最高频,每天上线很多次的情况都可以发生,所以我们在平台建设的时候也是优先做好这部分,但是对于环境、程序配置和SQL变更部分,通常情况下会优先级低一些,不是这些不重要,只是暂时通过手工操作或者人力顶一下这部分的任务,最终这些问题是要通过平台自动化来解决的。
底层物理环境配置
很久以前,计算资源成本高昂,导致机器匮乏,很难做到「开发-测试-预发-生产」物理环境配置的统一。线上用高配的物理机,线下用低配的过保机器,甚至用虚拟机,这都是很常见的做法。不同环境之间物理资源的不同加大了环境配置的管理难度。比如一个Java 程序需要 4G 的内存,这在线上没问题,但是线下的虚拟机可能 1G 的内存都没有。同样的配置在两个环境中需要小心维护否则程序就崩了,所以经常有很多文档记录这些「魔法」骚操作,然后在操作环境时拿出来翻一翻。
现在随着计算资源价格下降、云计算快速普及,尤其是 k8s 的出现,大大降低了保持「开发-测试-预发-生产」环境一致性的成本,同时操作起来简便易行。所以工作中,我们要「尽量」保持这些底层基础设施的统一,这是做好上层很多工作的基础。
基础设施即代码(Infrastructure as Code, IaC)的出现把环境配置的问题变得更简单。IaC解决的最大问题是基础设施配置和管理的自动化。之前通过手工操作来配置和管理的服务器、网络等基础设施通过 IaC 把基础设施配置和管理自动化,大幅提升效率和可靠性。
- 1. 使用代码管理基础设施,大大提高效率。
- 2. 减少手工操作错误。
- 3. 代码可以版本控制,具备完整的跟踪性。
- 4. 自动化可以保证环境一致性。
- 5. 代码即文档,有利于团队协作。
之前Google是把 IaC 放到代码仓库中,SRE管共性的配置,研发小伙伴来管理每个服务独特的配置部分,这也是一种方法。但是鉴于国情,我还是觉得让 SRE 或者 Ops 来管更合适,这样也有利于划清职责边界。
我建议 1)梳理全公司的编译和运行时环境需求 2)把基础环境的固化到有版本控制的 Dockerfile中,3)然后研发效能平台引用这些基础镜像,最终达到编译和运行时受控。
编译时配置
在编译源代码前,我们通常会有一些编译时配置,要么写到配置文件中,要么通过传参的方式传进去,然后在编译时打到二进制程序里面。通常情况下编译时配置信息放到编译脚本中固化下来是个不错的最佳实践。比如我们经常遇到的 build.xml, pom.xml, build.gradle等。通常这些构建脚本是研发小伙伴会开发调试时会用到,研发管理平台通常也会用到这些构建脚本,但是有时也会传入一些其它的参数。此时研发效能管理平台就会自己记录一份当时运行的命令,以便后面排查之需,比如保障制品的可重现。
所以在这里,我们可以看到研发小伙伴会把大部分编译时配置放到构建脚本中,存在于代码仓库(repo)中和源代码一起进行版本管理;研发效能平台部署环境时,会从平台上传入参数进行「干净的」编译,此时平台会记录一份编译时的配置。这两处的编译时配置信息都很重要。
运行时配置
一旦我们的程序或者软件部署完成,通常在启动时还需要读取配置文件或者读取数据库加载一些动态的配置信息,这就是运行时配置。运行时配置是可以动态调整的,无需重新打包和部署。
有的公司会把运行时配置也放到代码仓库中一起管理,尤其当配置信息比较少,修改比较容易时。但是一旦部署上去想要修改,就要把运行的实例(机器/容器)中的运行时配置都需要修改一遍,虽然有ansible,saltstack,puppet,但操作也会麻烦、容易出错且会导致安全问题。通常情况下研发小伙伴是没有手动修改生产环境配置的权限。如果想一次更改多个服务多个实例的配置,这就会是个大问题。随着服务的增多,配置的复杂,我们就会遇到如下的问题:
- 配置文件分散:每个服务在自己仓库下维护一套配置,无法统一配置和管理
- 多环境配置文件难维护:通常「开发-测试-预发-生产」每个环境都有自己的一套环境配置,有的配置项需要统一,有的配置项需要区分。
- 配置文件无法实时更新:配置文件修改后,必须重启服务才能生效配置,无法实时更新,对用户不友好。
为了解决以上问题,通常公司会引入配置中心来解决,比如apollo,disconf,nacos,SpringCloud Config等。这些都是市面上比较常见的配置中心选型。
- 首先把项目中各种配置全部都放到一个集中的地方进行统一管理,并提供一套标准的接口。
- 当各个服务需要获取配置时,就来配置中心接口拉取自己的配置。
- 当配置中心中的各种参数有更新的时候,也能通知到各个服务实时同步最新的信息,使之动态更新
数据库配置,数据库变更管理
我们在上线应用的时候,通常也伴随SQL变更,主要的需求
- SQL上线审批流:做某些关键变更要有人审批,比如上级、DBA等
- SQL语句检查、审核和执行等:SQL语句要正确,执行没有问题
- 角色和权限:只能查询和变更自己有权限的 DB
可以试试Yearning/Themis/inceptior这三个工具,我们也是在开源工具的基础上进行了二次开发,主要是打通了用户、权限和应用部分。之前申请个DB 还需要在数百个DB中去寻找,现在只要登录就会列出自己有权限的 DB。但这部分还没有完全整合到我们的流水线/发布单/上线单体系中去,这是一个需要继续发力的点。
统一变更流程和平台
「生产->测试」环境之间的配置变更,通常由QA小伙伴来负责,比如把生产环境的表结构应用到测试环境。
「开发->测试->预发->生产」这样的配置晋级流程通常由研发的小伙伴来完成。具体的情况说明,可以参考我《研发效能之环境管理》的这篇文章。做好变更风险管控就好。
我个人觉得SQL 上线,配置文件上线,前端 CDN 都应该整合到应用上线流程中去,而不是单独有一个平台来承载。这样数据打通、角色和权限打通、流程打通,统一的体验和流程,解决了各种系统间跳转带来的问题,提高了产研运各方的整体效能和工作体感,尤其是对于中小公司来说。
我的相关文章:
研发效能之环境管理
互联网公司研发效能/工程效率团队建设和规划
DevOps|研发效能+项目经理PMO
devops|中小公司不要做研发效能度量
研发效能负责人/研发效能1号位|DevOps负责人
DevOps |研发效能之环境、程序、配置、SQL变更管理的更多相关文章
- 「产品运营」研发效能之DevOps平台如何运营?
有人常说「酒香不怕巷子深」.不是的,如果这个巷子是酒吧街,那最深的那家酒吧肯定是租金最便宜的.酒吧的地段好坏已经在租金价格上体现出来了.现在已经不是那个工具缺乏.有个工具就拍手称快.欣然去试用的时代了 ...
- DevOps|从特拉斯辞职风波到研发效能中的不靠谱人干的荒唐事
今天发生了一件大事特拉斯辞任英国首相,我想借着这件事情说下我看到的一件研发效能的荒唐事,这其中的关联也许就是「都用了不靠谱的人」. 两件事情 今儿一早就听到,2022年10月20日英国第78任首相伊丽 ...
- DevOps | 如何快速提升团队软件开发成熟度,快速提升研发效能?
今天一个小伙伴问我,如何「快速提升」一个团队的软件开发成熟度?我犯难了.我个人理解一个团队的软件开发成熟度涉及的东西很多,但最简单最直接的方法就是发钱涨工资,可是估计很多公司不愿意,那就只有扣了. 快 ...
- 研发效能|DevOps 已死平台工程永存带来的焦虑
最近某位大神在推特上发了一个帖子,结果引来了国内众多卖课机构.培训机构的狂欢,开始贩卖焦虑,其实「平台工程」也不是什么特别高深莫测的东西.闲得无聊,把这位大神的几个帖子薅了下来,你看过之后就会觉得没啥 ...
- devops|中小公司不要做研发效能度量
我特别反感那些不顾公司现状一上来就想要做研发效能度量的人,尤其是想把研发效能度量当成锤子四处去敲打螺丝钉的人. 没几个人的小公司上来就做研发效能度量,就如同普通人一上来直接问媒婆怎么能娶到迪丽热巴.解 ...
- 研发效能DevOps推荐书单
专注 300 页之内的经典书籍推荐 研发效能涉及的知识很多,从大的方向去划分包括制度.组织.平台.运营等:单从软件研发的角度去看也包括很多,包括最底层的软工认知.实践,到团队管理和组织.敏捷研发,项目 ...
- 研发效能负责人/研发效能1号位 |DevOps负责人
想要做好业务,老板们除了要梳理好公司级别的业务目标,公司的组织架构,还要搭个有产出的班子,也就是找负责人.建团队,让组织架构充实起来.搭班子最重要的就是把负责人找到,就是团队1号位的人.本文主要讲团队 ...
- DevOps|研发效能价值如何衡量
现在很多公司都在做或者计划做研发效能,也知道研发效能工作很重要,能提高产研运同学的协同效率,提高员工的工作效率和质量,提高业务交付效率和交付质量,但是价值有多大?效率又有多高呢?因为不容易说清楚,所以 ...
- 互联网公司员工职级、研发效能度量、OKR与绩效考核
今天要写这篇文章,来自最近有两个点触动了我.第一个触动点是奈飞(netflix)做出了一个巨大动作<"不搞职级.人人平等" 25 年后行不通了?Netflix 破天荒引入细分 ...
- 研发效能之技术治理&技术治理架构师
最近很多公司专门设置了一个职位叫「技术治理架构师」,主要负责公司技术治理相关事宜.这是个非常有意思的职位.技术治理的活,之前我们也是做的,只是没有提的这么明确,一般都是研发效能团队.PMO.架构团队. ...
随机推荐
- Abp Vnext 动态(静态)API客户端源码解析
根据以往的经验,通过接口远程调用服务的原理大致如下: 服务端:根据接口定义方法的签名生成路由,并暴露Api. 客户端:根据接口定义方法的签名生成请求,通过HTTPClient调用. 这种经验可以用来理 ...
- 【数据库】时区及JDBC的时区设置
JDBC连接时有个TimeZone配置,这玩意到底有用吗?我是使用Postgresql和Mysql两个数据库验证的.结果如下: 数据库 部署方式 版本 JDBC连接TimeZone参数 JDBC连接s ...
- 用token辅助 密码爆破
第一步:打开皮卡丘,点击暴力破解,token防爆破,输入正确用户名,错误密码 BP拦截请求,点击皮卡丘Login,然后拦截后, 发送给Intruder 第二步: 爆破方式选择音叉方式, & ...
- Nucleic Acids Research上关于生物医学分析Galaxy平台在几个独立面上的最新发展。
该平台的官方主服务器拥有超过124000注册用户,每月新注册用户~2000。平均而言,......
本文分享自微信公众号 - 生信科技爱好者(bioitee).如有侵权,请联系 support@oschina.cn 删除.本文参与"OSC源创计划",欢迎正在阅读的你也加入,一起分 ...
- Vue自定义指令-让你的业务开发更简单
1.使用场景 在日常开发中,我们会将重复代码抽象为一个函数或者组件,然后在需要时调用或者引入.但是,对于某些功能,这种方法可能不够优雅或者不够灵活.例如,我们可能需要在DOM元素上添加一些自定义属性或 ...
- MVC 模式和三层架构
1. MVC 模式 MVC 模式和三层架构是一些理论的知识,将来我们使用了它们进行代码开发会让我们代码维护性和扩展性更好. MVC 是一种分层开发的模式,其中: M:Model,业务模型,处理 ...
- 多个视频文件合成画中画效果(Python、ffmpeg)
Step 1 从视频中分离出音频(MP4->mp3) def separateMp4ToMp3(tmp): mp4 = tmp.replace('.tmp', '.mp4') print('-- ...
- 【webpack系列】从基础配置到掌握进阶用法
前言 本篇文章将介绍一些webpack的进阶用法,演示内容继承自上一篇文章的内容,所以没看过上一篇文章的建议先学习上一篇内容再阅读此篇内容,会更有利于此篇的学习- 文件指纹 文件指纹指的是打包输出的文 ...
- 【后端面经-Java】AQS详解
目录 1. AQS是什么? 2. AQS核心思想 2.1 基本框架 2.1.1 资源state 2.1.2 CLH双向队列 2.2 AQS模板 3. 源码分析 3.1 acquire(int) 3.1 ...
- SaaS软件工程师成长路径
背景 SaaS软件工程师的成长需要循序渐进,和SaaS业务一样有耐心.SaaS工程师需要在"业务"."技术"."管理"三个维度做好知识储备. ...