在11月4日举办的2021腾讯数字生态大会云原生专场上,腾讯云联合中国信通院、作业帮等率先在国内重磅发布了《降本之源-云原生成本管理白皮书》(简称白皮书),基于腾讯云在业内最大规模的 Kubernetes 实践经验,系统性呈现云原生成本优化方法论和最佳实践路径。

腾讯云容器产品总经理邹辉表示:“Kubernetes 是云原生技术栈的核心,腾讯云原生经过多年的技术积累以及众多腾讯内外部复杂业务考验已经步入非常成熟的阶段。TKE 目前拥有国内最大规模的 Kubernetes 集群以及业界最好的 Kubernetes 成本优化实践;目前 TKE 运行着 900 万+个 Pod ,管理了数千万 CPU 核;同时我们大规模在腾讯内部核心业务中应用了成本优化技术,CPU 利用率最高提升了3倍;在腾讯外部,小红书80%的业务都跑在TKE上,成本降低了40%。”

作业帮基础架构负责人董晓聪表示,容器及kubernetes等云原生技术给企业带来一次技术重塑的机会,我们和腾讯云一起,在性能优化,调度增强,在离线混部,serverless kubernetes等方面做了很多探索和实践,最终取得不错的成绩,容器化的收益显著,同样业务容器化前后,成本下降43%,稳定性提升到99.995%,接口响应提升10%。有效支持了作业帮业务的快速迭代。

当前,越来越多的企业开始拥抱云计算,但随着用云程度的加深,云资源浪费的问题也变得越发明显。白皮书指出,弹性按需是云原生的资源利用优势,但如果资源配置策略设置不合理可能会导致资源的浪费。此外,云原生资源利用的计量方式如果不够灵活,会使得企业难以准确调控用云成本,因此,企业在应用云原生架构之后,需要考虑如何管理、优化和使用云原生服务来进一步提升业务的数字化转型效。

基于丰富的海量应用服务经验,腾讯云原生在内部和外部都有着成熟的资源优化方法论。在内部,腾讯云采用资源利用率成熟度模型,通过四个阶段对业务进行容器化,最终实现利用率达到60~70%。在外部,腾讯云推出了容器产品“成本大师”,从成本洞察、成本优化、成本运营三个层面来协助企业做更好的成本管理。

据介绍,成本大师具有全链路的成本优化能力,能够精确智能的进行成本洞察,一分钟发现资源浪费,并提供8种弹性策略组合,满足任意场景的弹性需求,而全构混部是业内首家云上支持 CPU/GPU 的混部产品,覆盖腾讯千万核资源规模。核心能力 qGPU,是强隔离的 GPU 虚拟化技术,该技术在业内首次实现了 GPU 算力、显存和故障的强隔离,支持算力精细切分共享和多优先级混部, GPU 利用率最高可提升230%。

《降本之源-云原生成本管理白皮书》正是腾讯基于内外云原生成本管理最佳实践,并结合行业优秀案例,提出的一套体系化的云原生成本优化方法论和最佳实践路径。旨在帮助企业改善用云成本,充分发挥云原生的效能和价值。

此外,白皮书中,腾讯云还通过对数十个客户的详细访谈,了解到在企业实际成本管理中存在的焦点问题,并基于资源利用率的现状和挑战,整理出企业使用的“成本洞察”、“成本优化”、“成本运营”三阶段云原生成本管理模型。

成本洞察即团队需要定义一致的标签和命名空间来改善分配,基于多维度(如云产品、环境、业务线)的资源和成本的可视化分析,能够帮助团队有效地建立起相应的问责机制,并根据获取到的实时数据快速制定优化方案及措施。

成本优化是对云资源规格、数量的调整,也包含了对业务的架构优化、以及通过弹性能力和资源混部等手段提升资源利用率。主要方案包括:设置合适的资源请求,通过动态调度解决资源碎片的问题,提高装箱率。通过弹性和混部做到按需使用;对于固定资源池,对负载峰值在不同时段的在线应用、在离线应用进行混部,做到分时复用;针对 GPU 资源,实现资源的池化和共享。

成本运营则是鼓励企业从组织、文化、流程等方面建设成本运营体系,根据目标持续不断调整和优化。具体方案包括:建立成本优化团队,推动成本优化意识,数据驱动成本优化,在流程中考察成本以及量化成本优化交付的业务价值。

白皮书围绕该模型,并结合企业实际落地情况提供成本管理的最佳实践,帮助企业上云、云原生改造时兼顾成本优化,助力数字化转型。

此外,白皮书还收录了腾讯内外部10余个企业降本实践案例。将包括作业帮、云集、QQ 浏览器、腾讯广告等企业或业务上云遇到的成本挑战及降本实践全方位呈现,为其他企业运维减负提供了详实的参考。

除了《云原生成本管理白皮书》,针对容器的安全难题,腾讯云容器服务TKE还联合腾讯安全云鼎实验室,发布了《腾讯云容器安全白皮书》。白皮书对腾讯云容器用户进行了深入的调研和走访,同时结合长期以来的容器安全运营实践,详细梳理并分析了容器环境所面临的安全威胁和挑战,并介绍了腾讯云在云原生容器安全建设上的思路、方案以及实践,希望以这样的方式共同推动云原生安全的发展。这也是国内首次大规模的对容器环境安全现状进行的分析总结。

![]https://qcloudimg.tencent-cloud.cn/raw/591b70bfb1ca45b346a7ce5d961c8f52.png()

据介绍,腾讯云一直致力于在云原生领域为用户提供更全面、更稳定、更安全的云原生服务。在云原生产品的设计和实现之初,就充分融入了安全性的设计和考虑,使云原生系统天然具备安全特性,使安全成为像计算、存储、网络一样的基础能力,助力用户实现应用系统的云原生化,并且持续的保障其安全稳定的运行。

更多细节内容,可点击关注【腾讯云原生】公众号回复“白皮书”下载《降本之源-云原生成本管理白皮书》进行了解。

【腾讯云原生】云说新品、云研新术、云游新活、云赏资讯,扫码关注同名公众号,及时获取更多干货!!

腾讯云联合中国信通院&作业帮等首发《降本之源-云原生成本管理白皮书》的更多相关文章

  1. ServerlessBench 2.0:华为云联合上海交大发布Serverless基准测试平台

    摘要:华为云联合上海交大重磅推出ServerlessBench 2.0,为社区提供涵盖12类基准测试用例.新增5大类跨平台测试用例.4大类关键特性指标.且多平台兼容的Serverless开放基准测试集 ...

  2. 作业帮上万个 CronJob 和在线业务混部,如何解决弱隔离问题并进一步提升资源利用率?

    作者 吕亚霖,作业帮基础架构 - 架构研发团队负责人.负责技术中台和基础架构工作.在作业帮期间主导了云原生架构演进.推动实施容器化改造.服务治理.GO 微服务框架.DevOps 的落地实践. 别路,作 ...

  3. TKE用户故事 | 作业帮检索服务基于Fluid的计算存储分离实践

    作者 吕亚霖,2019年加入作业帮,作业帮基础架构-架构研发团队负责人,在作业帮期间主导了云原生架构演进.推动实施容器化改造.服务治理.GO微服务框架.DevOps的落地实践. 张浩然,2019年加入 ...

  4. TKE 用户故事 | 作业帮 Kubernetes 原生调度器优化实践

    作者 吕亚霖,2019年加入作业帮,作业帮架构研发负责人,在作业帮期间主导了云原生架构演进.推动实施容器化改造.服务治理.GO微服务框架.DevOps的落地实践. 简介 调度系统的本质是为计算服务/任 ...

  5. 腾讯云联合多家生态伙伴,重磅开源 SuperEdge 边缘容器项目

    在2020年12月19-20日腾讯 Techo Park 开发者大会上,腾讯云联合英特尔.VMware 威睿.虎牙.寒武纪.美团.首都在线,共同发布 SuperEdge 边缘容器开源项目. Super ...

  6. 又拍云叶靖:OpenResty 在又拍云存储中的应用

    2019 年 7 月 6 日,OpenResty 社区联合又拍云,举办 OpenResty × Open Talk 全国巡回沙龙·上海站,又拍云平台开发部负责人叶靖在活动上做了<OpenRest ...

  7. 像智能手机一样管理云端应用:阿里云联合微软全球首发开放应用模型(OAM)

    2019 年 10 月 17 日上午 9 点 15 分,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟在 QCon 上海<基于云架构的研发模式演进>主题演讲中,正式宣布: " ...

  8. 云资源中的低成本战斗机——竞价实例,AWS、阿里云等六家云厂商完全用户使用指南

    云端资源价格 预留实例:长期持有,批发路线,价格最便宜. 按需实例:即买即用,零售路线,价格最贵. 这两种资源,基于不同区域/价格的六家云厂商价格对比,连同原始数据文档我们已经打包成了一份电子文档,有 ...

  9. 奇点云 x 阿里云 | 联合发布综合体数字化转型与数据创新解决方案

    2019年7月25日下午,在阿里云峰会上海站,奇点云入选阿里云首批联合解决方案合作伙伴,并联合发布了“综合体数字化转型与数据创新解决方案”,共同探索综合体的智能服务. 关于综合体的数字化转型,奇点云联 ...

随机推荐

  1. 『学了就忘』Linux基础 — 14、Linux系统的设备文件名和挂载

    目录 1.设备文件名 (1)为什么需要设备文件名 (2)硬件设备文件名命名规则 2.挂载点 3.挂载 (1)什么是挂载 (2)挂载前的分区要求 (3)小结(重点) 1.设备文件名 (1)为什么需要设备 ...

  2. F. Mattress Run 题解

    F. Mattress Run 挺好的一道题,对于DP的本质的理解有很大的帮助. 首先要想到的就是将这个拆成两个题,一个dp光求获得足够的夜晚的最小代价,一个dp光求获得足够的停留的最小代价. 显然由 ...

  3. LoadRunner12回放与录制

    系统版本 本人的操作系统是win10 版本是loadrunner12. 开启loadrunner自带的机票预订服务器 找到loadrunner自带的机票预订测试服务器下图中点击启动 如下图所示代表启动 ...

  4. Java学习(二十一)

    今天学的访问控制权限修饰符: 和c++比多了一个缺省,基本和c++功能一样,private多了一个同包的限制. 缺省的话是同包就可访问. 基本都学过,所以理解的也很快. 然后又把最近学得总结了一下: ...

  5. 利用opencv进行简易的拍照并处理照片

    今天用python写了一个调用摄像头拍照并对图片进行素描化或动漫化的小demo. 首先我的环境是:PyCharm+python3.8+opencv-python(4.4.0.42) 我们分析一下思路, ...

  6. PAT A1024题解——高精度大数相加模板

    PAT:A1024 Palindromic Number A number that will be the same when it is written forwards or backwards ...

  7. 一文了解Docker基本概念

    一.何为Docker Docker 是一个用于开发.交付和运行应用程序的开放平台,Docker 使您能够将应用程序与基础环境分开,以便您可以快速交付软件.借用百度百科的话来说,Docker 是一个开源 ...

  8. [luogu7078]贪吃蛇

    结论:若$a_{n}-a_{1}\ge a_{2}$,那么一定会吃掉 证明:分类讨论,若$a_{n-1}$也吃掉了$a_{2}$,就说明$a_{n-1}$之后不会被吃掉,而$a_{n-1}-a_{2} ...

  9. [bzoj1415]聪聪与可可

    直接求出任意两点的距离后记忆化搜索,用f[i][j]表示聪聪在i,可可在j的期望步数,由于i和j的最短路单调递减,所以搜不到环 1 #include<bits/stdc++.h> 2 us ...

  10. 第08章 MySQL聚合函数

    第08章 MySQL聚合函数 我们上一章讲到了 SQL 单行函数.实际上 SQL 函数还有一类,叫做聚合(或聚集.分组)函数,它是对一组数据进行汇总的函数,输入的是一组数据的集合,输出的是单个值. 1 ...