在11月4日举办的2021腾讯数字生态大会云原生专场上,腾讯云联合中国信通院、作业帮等率先在国内重磅发布了《降本之源-云原生成本管理白皮书》(简称白皮书),基于腾讯云在业内最大规模的 Kubernetes 实践经验,系统性呈现云原生成本优化方法论和最佳实践路径。

腾讯云容器产品总经理邹辉表示:“Kubernetes 是云原生技术栈的核心,腾讯云原生经过多年的技术积累以及众多腾讯内外部复杂业务考验已经步入非常成熟的阶段。TKE 目前拥有国内最大规模的 Kubernetes 集群以及业界最好的 Kubernetes 成本优化实践;目前 TKE 运行着 900 万+个 Pod ,管理了数千万 CPU 核;同时我们大规模在腾讯内部核心业务中应用了成本优化技术,CPU 利用率最高提升了3倍;在腾讯外部,小红书80%的业务都跑在TKE上,成本降低了40%。”

作业帮基础架构负责人董晓聪表示,容器及kubernetes等云原生技术给企业带来一次技术重塑的机会,我们和腾讯云一起,在性能优化,调度增强,在离线混部,serverless kubernetes等方面做了很多探索和实践,最终取得不错的成绩,容器化的收益显著,同样业务容器化前后,成本下降43%,稳定性提升到99.995%,接口响应提升10%。有效支持了作业帮业务的快速迭代。

当前,越来越多的企业开始拥抱云计算,但随着用云程度的加深,云资源浪费的问题也变得越发明显。白皮书指出,弹性按需是云原生的资源利用优势,但如果资源配置策略设置不合理可能会导致资源的浪费。此外,云原生资源利用的计量方式如果不够灵活,会使得企业难以准确调控用云成本,因此,企业在应用云原生架构之后,需要考虑如何管理、优化和使用云原生服务来进一步提升业务的数字化转型效。

基于丰富的海量应用服务经验,腾讯云原生在内部和外部都有着成熟的资源优化方法论。在内部,腾讯云采用资源利用率成熟度模型,通过四个阶段对业务进行容器化,最终实现利用率达到60~70%。在外部,腾讯云推出了容器产品“成本大师”,从成本洞察、成本优化、成本运营三个层面来协助企业做更好的成本管理。

据介绍,成本大师具有全链路的成本优化能力,能够精确智能的进行成本洞察,一分钟发现资源浪费,并提供8种弹性策略组合,满足任意场景的弹性需求,而全构混部是业内首家云上支持 CPU/GPU 的混部产品,覆盖腾讯千万核资源规模。核心能力 qGPU,是强隔离的 GPU 虚拟化技术,该技术在业内首次实现了 GPU 算力、显存和故障的强隔离,支持算力精细切分共享和多优先级混部, GPU 利用率最高可提升230%。

《降本之源-云原生成本管理白皮书》正是腾讯基于内外云原生成本管理最佳实践,并结合行业优秀案例,提出的一套体系化的云原生成本优化方法论和最佳实践路径。旨在帮助企业改善用云成本,充分发挥云原生的效能和价值。

此外,白皮书中,腾讯云还通过对数十个客户的详细访谈,了解到在企业实际成本管理中存在的焦点问题,并基于资源利用率的现状和挑战,整理出企业使用的“成本洞察”、“成本优化”、“成本运营”三阶段云原生成本管理模型。

成本洞察即团队需要定义一致的标签和命名空间来改善分配,基于多维度(如云产品、环境、业务线)的资源和成本的可视化分析,能够帮助团队有效地建立起相应的问责机制,并根据获取到的实时数据快速制定优化方案及措施。

成本优化是对云资源规格、数量的调整,也包含了对业务的架构优化、以及通过弹性能力和资源混部等手段提升资源利用率。主要方案包括:设置合适的资源请求,通过动态调度解决资源碎片的问题,提高装箱率。通过弹性和混部做到按需使用;对于固定资源池,对负载峰值在不同时段的在线应用、在离线应用进行混部,做到分时复用;针对 GPU 资源,实现资源的池化和共享。

成本运营则是鼓励企业从组织、文化、流程等方面建设成本运营体系,根据目标持续不断调整和优化。具体方案包括:建立成本优化团队,推动成本优化意识,数据驱动成本优化,在流程中考察成本以及量化成本优化交付的业务价值。

白皮书围绕该模型,并结合企业实际落地情况提供成本管理的最佳实践,帮助企业上云、云原生改造时兼顾成本优化,助力数字化转型。

此外,白皮书还收录了腾讯内外部10余个企业降本实践案例。将包括作业帮、云集、QQ 浏览器、腾讯广告等企业或业务上云遇到的成本挑战及降本实践全方位呈现,为其他企业运维减负提供了详实的参考。

除了《云原生成本管理白皮书》,针对容器的安全难题,腾讯云容器服务TKE还联合腾讯安全云鼎实验室,发布了《腾讯云容器安全白皮书》。白皮书对腾讯云容器用户进行了深入的调研和走访,同时结合长期以来的容器安全运营实践,详细梳理并分析了容器环境所面临的安全威胁和挑战,并介绍了腾讯云在云原生容器安全建设上的思路、方案以及实践,希望以这样的方式共同推动云原生安全的发展。这也是国内首次大规模的对容器环境安全现状进行的分析总结。

![]https://qcloudimg.tencent-cloud.cn/raw/591b70bfb1ca45b346a7ce5d961c8f52.png()

据介绍,腾讯云一直致力于在云原生领域为用户提供更全面、更稳定、更安全的云原生服务。在云原生产品的设计和实现之初,就充分融入了安全性的设计和考虑,使云原生系统天然具备安全特性,使安全成为像计算、存储、网络一样的基础能力,助力用户实现应用系统的云原生化,并且持续的保障其安全稳定的运行。

更多细节内容,可点击关注【腾讯云原生】公众号回复“白皮书”下载《降本之源-云原生成本管理白皮书》进行了解。

【腾讯云原生】云说新品、云研新术、云游新活、云赏资讯,扫码关注同名公众号,及时获取更多干货!!

腾讯云联合中国信通院&作业帮等首发《降本之源-云原生成本管理白皮书》的更多相关文章

  1. ServerlessBench 2.0:华为云联合上海交大发布Serverless基准测试平台

    摘要:华为云联合上海交大重磅推出ServerlessBench 2.0,为社区提供涵盖12类基准测试用例.新增5大类跨平台测试用例.4大类关键特性指标.且多平台兼容的Serverless开放基准测试集 ...

  2. 作业帮上万个 CronJob 和在线业务混部,如何解决弱隔离问题并进一步提升资源利用率?

    作者 吕亚霖,作业帮基础架构 - 架构研发团队负责人.负责技术中台和基础架构工作.在作业帮期间主导了云原生架构演进.推动实施容器化改造.服务治理.GO 微服务框架.DevOps 的落地实践. 别路,作 ...

  3. TKE用户故事 | 作业帮检索服务基于Fluid的计算存储分离实践

    作者 吕亚霖,2019年加入作业帮,作业帮基础架构-架构研发团队负责人,在作业帮期间主导了云原生架构演进.推动实施容器化改造.服务治理.GO微服务框架.DevOps的落地实践. 张浩然,2019年加入 ...

  4. TKE 用户故事 | 作业帮 Kubernetes 原生调度器优化实践

    作者 吕亚霖,2019年加入作业帮,作业帮架构研发负责人,在作业帮期间主导了云原生架构演进.推动实施容器化改造.服务治理.GO微服务框架.DevOps的落地实践. 简介 调度系统的本质是为计算服务/任 ...

  5. 腾讯云联合多家生态伙伴,重磅开源 SuperEdge 边缘容器项目

    在2020年12月19-20日腾讯 Techo Park 开发者大会上,腾讯云联合英特尔.VMware 威睿.虎牙.寒武纪.美团.首都在线,共同发布 SuperEdge 边缘容器开源项目. Super ...

  6. 又拍云叶靖:OpenResty 在又拍云存储中的应用

    2019 年 7 月 6 日,OpenResty 社区联合又拍云,举办 OpenResty × Open Talk 全国巡回沙龙·上海站,又拍云平台开发部负责人叶靖在活动上做了<OpenRest ...

  7. 像智能手机一样管理云端应用:阿里云联合微软全球首发开放应用模型(OAM)

    2019 年 10 月 17 日上午 9 点 15 分,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟在 QCon 上海<基于云架构的研发模式演进>主题演讲中,正式宣布: " ...

  8. 云资源中的低成本战斗机——竞价实例,AWS、阿里云等六家云厂商完全用户使用指南

    云端资源价格 预留实例:长期持有,批发路线,价格最便宜. 按需实例:即买即用,零售路线,价格最贵. 这两种资源,基于不同区域/价格的六家云厂商价格对比,连同原始数据文档我们已经打包成了一份电子文档,有 ...

  9. 奇点云 x 阿里云 | 联合发布综合体数字化转型与数据创新解决方案

    2019年7月25日下午,在阿里云峰会上海站,奇点云入选阿里云首批联合解决方案合作伙伴,并联合发布了“综合体数字化转型与数据创新解决方案”,共同探索综合体的智能服务. 关于综合体的数字化转型,奇点云联 ...

随机推荐

  1. Python AttributeError: module 'sys' has no attribute 'setdefaultencoding'

    Python 3 与 Python 2 有很大的区别,其中Python 3 系统默认使用的就是utf-8编码. 所以,对于使用的是Python 3 的情况,就不需要sys.setdefaultenco ...

  2. atcoder ABC233

    B 题意 给一个字符串, 可以把第一个字母移到最后, 也可以把最后一个字母放第一个, 问字典序最大最小的字符串. 题解 把第一个放最后一个, 相当于把最后一个放第一个执行n-1次, 那么我们不妨只进行 ...

  3. 学会python永不加班系列之操作excel

    python作为一种解释性语言,简单高效的模式逐渐火爆.同时存在多种扩展性. 永不加班系列 python正确操作excel 实验环境: 系统:win10 语言:python3.8 承载软件:pycha ...

  4. java核心技术 第3章 java基本程序设计结构

    类名规范:以大写字母开头的名词 若由多个单词组成 每个单词的第一个字母应大写(驼峰命名法)  与.java文件名相同 运行程序:java ClassName(dos命令) 打印语句:System.ou ...

  5. Screenshot 库和Collections 库

    一.screenShot 是 robot framework的标准类库,用于截取当前窗口,需要手动加载. 示例: 运行结果: 二.Collections 库 Collections 库同样为 Robo ...

  6. tomcat9启动报错too low setting for -Xss

    在tomcat下部署war包启动时报错,关键错误信息如下: Caused by: java.lang.IllegalStateException: Unable to complete the sca ...

  7. 12组-Alpha冲刺-2/6

    一.基本情况 队名:字节不跳动 组长博客:https://www.cnblogs.com/147258369k/p/15535639.html 小组人数:10人 二.冲刺概况汇报 侯钦凯 过去两天完成 ...

  8. 记一次 .NET 某电商无货源后端服务 死锁分析

    一:背景 1. 讲故事 这个月初,星球里的一位朋友找到我,说他的程序出现了死锁,怀疑是自己的某些写法导致mongodb出现了如此尴尬的情况,截图如下: 说实话,看过这么多dump,还是第一次遇到真实的 ...

  9. [loj3331]选课

    考虑$P=0$,由于$T-\sum_{i=1}^{m}s_{i}\le 40$,因此一个第$i$个分类中最多得到$s_{i}+42$的学分,可以对每一类分别背包 暴力背包复杂度为$o(n^{2})$, ...

  10. [luogu3733]八纵八横

    根据$[WC2011]XOR$的思路,每次暴力重构线性基,令$l'=\frac{l^{2}}{w}$,则有一个$nql'$的做法(这里线性基位数很多,所以要用bitset) 由于初始连通,因此每一个环 ...