国际权威知名调研机构 Gartner 在《2023年最重要的10个技术趋势》报告中将平台工程(Platform Engineering)列为高速发展的技术趋势之一,并预测到2026年80%的软件企业都将搭建平台团队以为内部的工程师提供可复用的服务、组件以及工具来帮助应用交付。

 



图源:Gartner

何谓平台工程(Platform Engineering)?

平台工程是一门新兴技术,专注于通过减少现代软件交付的复杂性和不确定性来提高开发人员的生产力。它解决了规模化DevOps的一些最大挑战,包括减少在整个应用生命周期内管理复杂工具和基础设施网络的负担。无论是基础设施配置、流水线、监控还是容器管理等,自助服务平台将所有这些复杂的问题放入黑盒中,进而为开发人员提供开箱即用的所有必要工具。

平台团队将基础设施管理自动化,并使开发人员能够从一个集中管理的技术平台上自助获取可靠的工具和工作流程。由于减轻了开发团队的认知负担,平台工程是云原生软件交付的一个重要转向。

平台工程 vs DevSecOps

正如我们之前诸多文章中阐述的那样,DevSecOps 将安全左移到开发流程中,借助各类工具简化部署、管理、监控以及安全治理等工作,在获得 DevOps 敏捷交付优势的同时还能保障软件开发的安全。而平台工程会借鉴 DevSecOps 的做法,采用这些工具、流程和最佳实践,并将其产品化为可重复使用的服务和工具,以便在企业内部的不同开发团队和实际场景中使用。

举个例子,企业里的每个产品团队都有证书轮换的需求,此时如果有一个统一的服务能解决这一需求将会省下许多麻烦,也就是需要解决方案可重复。那么如果有多个需求都与此类似,那么表明企业内部需要一个平台来统一解决此类问题,而不是让每个团队都重复造轮子。

平台工程是随着DevOps的成熟和规模的扩大而出现的。在DevOps(或 DevSecOps)的前期阶段企业内部的每个开发团队都会创造符合其自身需求的实践。例如,交付物可以是 Terraform 模板或 Terraform 模块,工程师随后可以 clone 并添加他们的配置,但在 clone 之后,就不再维护最初的那套模板或模块了。于是如果产生问题,那么问题的解决方案通常存在于各个团队内部。

随着企业的成熟和发展壮大,DevSecOps 会走向后期成熟阶段。在此阶段,企业开始收集数据点并了解 DevSecOps 工具和实践的影响,此时会发现不同团队正在分别解决同样的问题,这十分低效,因此企业内部各团队需要借助统一的共享平台来避免重复造轮子。

平台工程的主要优势

如上文所述,平台工程可以为研发团队提供更好的开发体验,这一小节我们将详细聊聊平台工程的主要优势。

加速开发周期

在没有平台工程的情况下,许多开发流程是手动的。无论是手动创建和配置代码仓库,管理云基础设施,还是创建CI/CD流水线,手动过程都需要时间,而且容易出错,许多安全问题恰恰由于配置错误产生

平台工程非常注重流程的自动化。因此,在自动化平台的帮助下,开发人员可以更快地传输他们的代码。现在,开发人员可以通过自助服务来启动环境和交付他们的软件版本,进而大大加快开发周期。一个与自动化测试集成的代码流水线将可以在不影响质量或进度的情况下为你的客户提供商业价值。因此,产品进入市场的时间将被缩短。

消除操作的复杂度

基础设施和应用程序的自助服务部署将会消除流程中的复杂度。平台工程会自动化整个 DevOps 周期,进而提升生产力以及减轻开发人员的负担。在传统方法里,开发人员依赖于 DevOps 团队创建和维护软件部署。现如今,借助自助服务门户,开发人员可以自主、快速交付新版本。这将会简化企业内部的开发流程。

将产品开发提升到新水准

有这样一个场景:开发者需要对微服务应用程序进行一个微小的更改,首先进入 staging 阶段,其次再进入生产环境。这是一个多集群 Kubernetes 环境。只有掌握了 Kubernetes、Helm chart 以及 Terraform 模块的开发者才能够自己完成所有的部署流程。但是规模较小的企业可能没有预算来招聘这么多的资深开发者。那么,此时借助平台工程师的帮助,开发人员无需将此类工作推卸给运维团队,而仅需点击几下即可将代码推送到任意环境,而无需了解复杂的底层架构。这改善了不同团队成员之间的反馈迭代,使产品更加完善,进而为客户带来巨大的商业价值。

通过环境自动化扩展应用程序

当前大多数 CI/CD 设置主要聚焦于容器镜像的更新。CI server 在配置中构建镜像并更新镜像路径。然而,当你需要完成以下事项时,则变得有些复杂:

  • 启动新环境
  • 移除环境镜像或更改现有环境的配置
  • 回滚新配置的环境
  • 从环境中添加/移除资源

平台工程师为开发环境提供全面的环境自动化,开发人员可以创建、复制、移除和更新部署环境而无需了解底层架构知识。这意味着,甚至初级的UX开发也可以自助使用环境,这个环境已经完全配置了开发者需要部署和测试的一切。自动化环境的能力可以让业务快速、高效增长。

上文所提到的平台工程团队的优势十分诱人,那么是否每个企业都需要采用呢?

企业何时需要平台工程团队?

如果企业内部已经有团队跨职能来管理应用基础设施、部署以及运维等工作,那么企业应该开始考虑平台工程,因为这在不知不觉之间已经完成了平台工程的部分内容。

另外,如果企业已经有一个成熟的产品,一个清晰的发展愿景并计划开始扩展市场,那么此时也是搭建平台团队的好时机。

如果企业管理者希望开发团队专注于产品的开发,而不是被基础设施配置、代码流水线设置、密钥管理等工作牵扯精力,那么企业需要一个平台工程团队。借助该团队的帮助,应用开发人员可以轻松将代码推送到生产环境中。

如果企业内部的工程团队人数正在增长,同时云原生应用也需要扩展,那么仅仅有技术专家是不够的,还需要团队之间的合作。在一个开发团队中,并不是所有的团队成员在技术上都善于处理扩展操作。团队中的一个薄弱环节会降低团队的速度,减慢整个开发周期的速度。在这种情况下,平台工程团队将是理想的选择。

另一方面,如果企业规模不大,仅有屈指可数的几位开发人员来构建一个单体应用,那么平台团队对于该企业来说收益并不大。此时,企业需要首先专注于实现产品与市场的契合,并将任何重复的任务自动化,使开发人员能够专注于创新。此后,开始将应用程序分割成单独的服务,需要由多个工程团队交付不同的价值时,可以开始引入平台团队,他们可以帮助你实现效率和稳定性的最佳平衡。

平台工程的实践原则

平台工程的原则和理论总结起来可以用一句话概括,即真正重要的是将平台工程付诸实践。平台团队一开始可以先从小处着手,聚焦于所有团队都会用到的技术栈。换言之,平台团队不应该构建一个类似于“万金油”的平台,而是关注某个具体的技术,比如容器和K8S。

平台搭建初期需要先确立目标,比如在不增加认知负荷的情况下实现开发者自助服务,或者在不强迫开发者学习以基础设施为中心的技术的情况下实现运维工单数量的减少。

构建平台最好的方式是采用产品的方法,即Platform as a Product,通过用户研究、征求用户反馈、获得内部相关方的认可,进而平台团队可以全面了解开发者的痛点和整个组企业所面临的共同挑战。这些决定了开发人员需要什么特性,进而构建包含这些解决方案的黄金通道。

但平台不止于此,成功的平台团队会持续保持与开发人员的沟通并跟踪一些指标(如部署频率、交付时间、稳定性等)以确保开发人员采用了平台并且对其开发体验有所改善。

平台团队及其所提供的黄金路径是将所有复杂设置黏合在一起的胶水,但由于平台团队只面向内部工作,许多企业错误地将其视为成本控制中心。平台团队应该努力争取利益相关者群体的内部认同,以确保其内部平台项目的长效性。

最后,也许也是最重要的一点,成功的平台团队应尽量避免重复造轮子。平台工程的 landscape 正在不断发展壮大,以解决广泛的问题。平台团队可以通过尽可能地定制现成的解决方案来节省时间和创造更多价值。

总结

本文我们详细介绍了平台工程(Platform Engineering)这一新兴技术,包括其与 DevSecOps 的关系、主要优势以及实践原则,作为 DevSecOps 成熟化、规模化的产物,平台工程可以帮助企业减轻开发人员的认知负担和基础运维的负担,避免重复造轮子,帮助企业提升开发效率,进而产生更大的商业价值。

平台工程101:Dev、Sec和Ops的自动化黏合剂的更多相关文章

  1. 研发效能|DevOps 已死平台工程永存带来的焦虑

    最近某位大神在推特上发了一个帖子,结果引来了国内众多卖课机构.培训机构的狂欢,开始贩卖焦虑,其实「平台工程」也不是什么特别高深莫测的东西.闲得无聊,把这位大神的几个帖子薅了下来,你看过之后就会觉得没啥 ...

  2. 改进的平台设备驱动——dev和drv完全分离

    这是平台设备: 1 #include <linux/fs.h> #include <linux/init.h> #include <linux/delay.h> # ...

  3. T-Pot平台cowrie蜜罐暴力破解探测及实现自动化邮件告警

    前言:Cowrie是基于kippo更改的中交互ssh蜜罐, 可以对暴力攻击账号密码等记录,并提供伪造的文件系统环境记录黑客操作行为, 并保存通过wget/curl下载的文件以及通过SFTP.SCP上传 ...

  4. 天马行空DevOps-Dev平台建设概述

    概述 DevOps(Development和Operations的组合词)是一组过程.方法与系统的统称,用于促进开发(应用程序/软件工程).技术运营和质量保障(QA)部门之间的沟通.协作与整合.它是一 ...

  5. 云原生时代的DevOps平台设计之道

    开发人员与运维人员是 IT 领域很重要的两大人群,他们都会参与到各种业务系统的建设过程中去.DevOps 是近年间火爆起来的一种新理念,这种理念被很多人错误的解读为"由开发人员(Dev)学习 ...

  6. 没有CTO的Netflix有哪些值得我们学习的工程文化?

    作者介绍: 杨波,拍拍贷基础框架研发总监.具有超过 10 年的互联网分布式系统研发和架构经验,曾先后就职于:eBay 中国研发中心(eBay CDC),任资深研发工程师,参与亿贝开放 API 平台研发 ...

  7. 用批处理编译*.sln工程

    原文:用批处理编译*.sln工程 批处理是直接调用Microsoft Visual Studio 8\Common7\IDE\ 目录内的 devenv.exe ,它启动后就是IDE,提供的参数如下: ...

  8. 46.Linux-分析rc红外遥控平台驱动框架,修改内核的NEC解码函数BUG(1)

    内核版本          :  Linux 3.10.14 rc红外接收类型:  GPIO 类型的NEC红外编码 本章内容 1) rc体系结构分析 2) 分析红外platform_driver平台驱 ...

  9. linux /dev/null 中有数据

    前段时间有个同事问我说,他 cat /dev/null有数据.这个颠覆大家认知的问题最终却是个小问题. 我们来看/dev/null的操作函数: static const struct memdev { ...

  10. 通过Ops Manager安装管理mongodb-3.4集群

    node1 Ops Manager,mongodb,agent node2 mongodb,agent node3 mongodb,agent 参考文档 https://docs.opsmanager ...

随机推荐

  1. python常用库总结

    图片处理相关 # opencvy pip install opencv-python pip install opencv-contrib-python pip install matplotlib ...

  2. 【炫丽】从0开始做一个WPF+Blazor对话小程序

    大家好,我是沙漠尽头的狼. .NET是免费,跨平台,开源,用于构建所有应用的开发人员平台. 本文演示如何在WPF中使用Blazor开发漂亮的UI,为客户端开发注入新活力. 注 要使WPF支持Blazo ...

  3. 介绍一个jmeter录制脚本谷歌插件 —— metersphere-chrome-plugin

    该插件可将用户在浏览器操作时的 HTTP 请求记录下来并生成 JMX 文件(JMeter 脚本文件). 1. 插件解压 插件下载链接: https://pan.baidu.com/s/14nGb_s9 ...

  4. Marktext语法——Emoji表情大全

    个人名片: 对人间的热爱与歌颂,可抵岁月冗长 Github‍:念舒_C.ying CSDN主页️:念舒_C.ying 个人博客 :念舒_C.ying People ️ ️ ️ ️ ‍♀️ ‍♀️ ‍♂ ...

  5. 线程(Thread)基本用法

    一.线程的调用 1.无参 def run_01(): for i in range(6, 10): print("test01", i) time.sleep(1) th_01 = ...

  6. JavaEE Day04 MySQL多表&事务

    今日内容 多表查询 事务 DCL用于控制权限和管理用户,DBA完成:SQL中四类DDL  DML  DQL  DCL 一.多表查询 1.多表查询_概述 1.1 查询语法     select      ...

  7. hashlib模块、subprocess模块、loggin日志模块及实战

    hashlib加密模块 目录 hashlib加密模块 加密补充说明 subprocess模块 logging日志模块 日志的组成 日志配置字典 配置参数 1.何为加密 将明文数据处理成密文数据 让人无 ...

  8. 如何取消磁盘的BitLocker加密

    步骤1:打开开始[win]菜单,点击齿轮图标,打开[设置] 步骤2:在Windows设置视窗中点击[更新和安全] 步骤3:点击左侧[设备加密],点击视窗右侧[关闭] 步骤4:将提示是否需要关闭设备加密 ...

  9. java逻辑运算中 | | 和 | 的区别

    本文主要阐明逻辑运算中 | |(短路或) 和 |(逻辑或) 的异同 | | 和 | 的相同之处: 只有二者都是假时,结果才为假,否则结果为true. | | 和 | 的不同之处在于: a | | b: ...

  10. (admin.E108) The value of 'list_display[0]' refers to 'productname', which is not a callable, an attribute of 'ProductAdmin', or an attribute or method on 'product.Product'.

    models.py # 创建产品表 class Product(models.Model): productName = models.CharField('产品名称', max_length=64) ...