智能 Request 推荐，K8s 资源利用率提升 252%

作者王孝威,FinOps 认证从业者,腾讯云容器服务产品经理,热衷于为客户提供高效的 Kubernetes 使用方式,为客户极致降本增效服务. 余宇飞,FinOps 认证从业者,腾讯云专家工程师,从事云原生可观测性.资源管理.降本增效产品的开发. 资源利用率为何都如此之低? 虽然 Kubernetes 可以有效的提升业务编排能力和资源利用率,但如果没有额外的能力支撑,提升的能力十分有限,根据 TKE 团队之前统计的数据: Kubernetes 降本增效标准指南| 容器化计算资源利用率现象剖析,…

kubernetes 降本增效标准指南| 资源利用率提升工具大全

背景公有云的发展为业务的稳定性.可拓展性.便利性带来了极大帮助.这种用租代替买.并且提供完善的技术支持和保障的服务,理应为业务带来降本增效的效果.但实际上业务上云并不意味着成本一定较少,还需适配云上业务的应用开发.架构设计.管理运维.合理使用等多方面解决方案,才能真正助力业务的降本增效.在<Kubernetes 降本增效标准指南>系列的上一篇文章<容器化计算资源利用率现象剖析>中可看到,IDC 上云后资源利用率提高有限,即使已经容器化,节点的平均利用率依旧仅在 13% 左右,资…

kubernetes 降本增效标准指南| 容器化计算资源利用率现象剖析

作者:詹雪娇,腾讯云容器产品经理,目前主要负责腾讯云集群运维中心的产品工作. 张鹏,腾讯云容器产品工程师,拥有多年云原生项目开发落地经验.目前主要负责腾讯云TKE集群和运维中心开发工作. 引言降本增效从云计算发展至今一直都是企业上云最核心的关注点,无论是在线业务还是大数据.AI业务,都非常依赖算力的消耗,成本问题都是企业上云进行决策的核心因素. 从云计算本身来看,单纯把业务从 IDC 搬迁上云不修改任何业务架构,提高计算资源利用率需要非常大的运维成本和人力成本投入到改造业务适配弹性伸缩和业务可…

作业帮上万个 CronJob 和在线业务混部，如何解决弱隔离问题并进一步提升资源利用率？

作者吕亚霖,作业帮基础架构 - 架构研发团队负责人.负责技术中台和基础架构工作.在作业帮期间主导了云原生架构演进.推动实施容器化改造.服务治理.GO 微服务框架.DevOps 的落地实践. 别路,作业帮基础架构-高级研发工程师,在作业帮期间,负责多云 K8s 集群建设.K8s 组件研发.Linux 内核优化调优相关工作. 背景作业帮在云原生容器化改造的过程中,随着集群规模越来越大.业务混合部署的场景越来越复杂,面临的集群问题也越来越多,走到了 Kubernetes 及容器化的深水区, 尤其是…

提升资源利用率的MapReduce框架

Hadoop系统提供了MapReduce计算框架的开源实现,像Yahoo!.Facebook.淘宝.中移动.百度.腾讯等公司都在借助 Hadoop进行海量数据处理.Hadoop系统性能不仅取决于任务调度器的分配策略,还受到分配后实际任务执行效率的影响,任务执行常常涉及读取.排序.归并.压缩.写入等具体阶段. HCE计算框架是一个开源项目,旨在通过优化任务执行的各个阶段,提升整个Hadoop系统的效率.与Hadoop Java框架相比,基于HCE框架的MapReduce任务最高可以节省超过30%的…

如何提升集群资源利用率？阿里容器调度系统Sigma 深入解析

阿里妹导读:为了保证系统的在线交易服务顺利运转,最初几年,阿里都是在双11大促来临之前大量采购机器储备计算资源,导致了双11之后资源大量闲置点现象.是否能把计算任务与在线服务进行混合部署,在现有弹性资源基础上提升集群资源利用率,降低双11资源新增成本? 今天,阿里测试开发专家何颖,将为你深入介绍阿里容器调度系统Sigma仿真平台Cerebro. Sigma 是阿⾥巴巴全集团范围的 Pouch 容器调度系统.2017年是 Sigma 正式上线以来第⼀次参与双11,在双11期间成功⽀撑了全集团所有容…

成本降低40%、资源利用率提高20%的 AI 应用产品云原生容器化之路

作者郭云龙,腾讯云高级工程师,目前就职于 CSIG 云产品三部-AI 应用产品中心,现负责中心后台业务框架开发. 导语为了满足 AI 能力在公有云 SaaS 场景下,服务和模型需要快速迭代交付的需求,保障服务在不稳定高并发时的高成功率,以及进一步提升资源利用率,AI 应用产品中心进行了一系列的调研与实践,本篇将重点介绍团队在容器化方面的实践经验. 背景和问题公有云 AI SaaS 产品(如人脸融合)的一般服务流程为:C 端或 B 端客户通过采集设备采集图像.音视频等,经由云 API 等接入…

k8s资源清单基础

资源清单介绍创建资源的方法 apiserver仅接收JSON格式的资源定义 yaml格式提供配置清单 apiserver可自动把yaml转换成json格式数据资源清单五个一级字段 1.apiVersion group/version 使用kubectl api-versions来获取 2.kind 资源类别 3.metadata 元数据 name namespace labels annotations 4.spec 期望的状态 5…

Linux下资源利用率监测利器—nmon使用

最近接了一个任务,就是测试公司服务器的资源利用率,这样对每种业务平时所占资源有了大体的了解,进而为下一步的虚拟化做准备.找了很多开源的工具,但都不理想,有的安装很复杂,需要联网(而我们的服务器很多都不能够联网):有的分析出的数据还需要自己汇总.统计等.最后找到了nmon,无需安装.支持绝大多数Linux发现版本.监测数据自动形成.nmon文档..nmom文档自动生成如表等等.利器啊~ 1.下载nmon_linux_more_14g.tar.gz,下载完成之后,我们可以看到nmon支持一下Linu…

使用 Ansible 统计服务器资源利用率

使用 Ansible 统计服务器资源利用率: 3 条 shell 脚本实现统计: CPU 利用率统计: top -bn1 | grep load | awk '{printf "CPU Load: %.2f\n", $(NF-2)}' 内存利用率统计: free -m | awk 'NR==2{printf "Memory Usage: %s/%sMB (%.2f%%)\n", $3,$2,$3*100/$2 }' 磁盘利用率统计(列出每块磁盘利用率): df -h…

Prometheus 监控K8S 资源状态对象

Prometheus 监控K8S 资源状态对象官方文档:https://github.com/kubernetes/kube-state-metrics kube-state-metrics是一个简单的服务,它监听Kubernetes API服务器并生成有关对象状态的指标.它不关注单个Kubernetes组件的运行状况,而是关注内部各种对象的运行状况,例如部署,节点和容器. 采集了k8s中各种资源对象的状态信息: kube-state-metrics kube_daemonset_* kube…

3.k8s资源控制器rs Deployment Job

k8s资源控制器 #控制器类型 ReplicaSet #rs,确保pod副本数,rs已替代rc Deployment #管理rs,升级.回滚.扩容pod DaemonSet #在每个节点运行一个Pod StateFulSet #解决有状态服务,Pod重新调度后PodName和HostName不变 Job/CronJob #批处理任务/定时任务 HPA #按CPU使用率或自定义metrics扩展Pod数量 Horizontal Pod Autoscaling #rs实例 #rs-demo.yaml…

使用Elastic Job的分片配置加速任务执行和提高资源利用率

上一篇,我们介绍了如何使用Elastic Job实现定时任务.解决了使用@Scheduled来实现时候存在的竞争问题,同时也实现了定时任务的高可用执行. 然而,还有一类问题是我们在做定时任务时候容易出现的,就是任务执行速度时间过长:同时,为了实现定时任务的高可用,还启动了很多任务实例,但每个任务执行时候就一个实例在跑,资源利用率不高. 所以,接下来我们就来继续介绍,使用Elastic Job的分片配置,来为任务执行加加速,资源利用抬抬高的目标! 动手试试建议直接下载文末仓库中的chapter7…

利用动态资源分配优化Spark应用资源利用率

背景在某地市开展项目的时候,发现数据采集,数据探索,预处理,数据统计,训练预测都需要很多资源,现场资源不够用. 目前该项目的资源3台旧的服务器,每台的资源内存为128G,cores 为24 (core可暂时忽略,以下仅考虑内存即可) . 案例分析我们先对任务分别分析,然后分类. 数据采集基于DC,接的是Kafka的源,属于流式,常驻任务.kafka来新数据时才需要资源,空闲时可释放.目前占用的资源情况为:28( topic数)*2(线程数)*1G = 56G,且该值会随着带采集增量表数量的…

k8s资源需求及资源限制

在k8s上,可由容器或pod请求或消费的计算资源时指cpu和内存,这也是目前仅有的受支持的两种类型.相比较来说,cpu属于可压缩资源,即资源额度可按需收缩,而内存则是不可压缩型资源,对其执行收缩操作可能会导致某种程度的问题. 目前来说,资源隔离尚且属于容器级别,cpu和内存资源的配置需要在pod中的容器上运行,每种资源均可由request属性定义其请求的确保可用值,即容器运行可能用不到这些额度的资源,但用到的时候必须要确保有如此多的资源可用,而limits属性则用于吸纳子资源可用的最大值,即硬限…

理解k8s资源限制系列（二）:cpu time

本文介绍几种在K8S中限制资源使用的几种方法. 资源类型在K8S中可以对两类资源进行限制:cpu和内存. CPU的单位有: 正实数,代表分配几颗CPU,可以是小数点,比如0.5代表0.5颗CPU,意思是一颗CPU的一半时间.2代表两颗CPU. 正整数m,也代表1000m=1,所以500m等价于0.5. 内存的单位: 正整数,直接的数字代表Byte k.K.Ki,Kilobyte m.M.Mi,Megabyte g.G.Gi,Gigabyte t.T.Ti,Terabyte p.P.Pi,Pe…

墙裂推荐 iOS 资源大全

这是个精心编排的列表,它包含了优秀的 iOS 框架.库.教程.XCode 插件.组件等等. 这个列表分为以下几个部分:框架( Frameworks ).组件( Components ).测试( Testing )和其他的开源项目,免费的和付费的服务.每个部分中的项目没有先后顺序,均是按照提交的先后顺序排列的. Swift 语言写成的项目会被标记为 ★ ,AppleWatch 的项目则会被标记为 ▲.你可以自由添加你的项目. [特别提示]:伯乐在线已经在 GitHub 上发起了 iOS 资源大全中…

k8s资源指标API及metrics-server资源监控

简述: 在k8s早期版本中,对资源的监控使用的是heapster的资源监控工具. 但是从 Kubernetes 1.8 开始,Kubernetes 通过 Metrics API 获取资源使用指标,例如容器 CPU 和内存使用情况. 这些度量指标可以由用户直接访问,例如通过使用kubectl top 命令,或者使用集群中的控制器. Metrics API: 通过 Metrics API,您可以获得 node 或 pod 当前的资源使用情况(但是不存储). metres-server比 heapst…

k8s资源清单定义入门

1.资源分类 a.workload型资源:service.pod.deployment.ReplicaSet.StatefulSet.Job.Cronjob; b.服务发现及服务均衡资源型资源:Service.Ingress; c.配置与存储型资源:Volume.ConfigMap.Secret.DownwardAPI.CSI(容器存储接口,可以扩展各种第三方的存储卷) d.集群级资源:Namespace.Node.Role.rolebinding.clusterrolebinding; e.元…

Linux学习（推荐学习资源）——保持更新

1. 介绍 Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和Unix的多用户.多任务.支持多线程和多CPU的操作系统.它能运行主要的Unix工具软件.应用程序和网络协议.它支持32位和64位硬件.Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统(度娘).Linux系统大致分为两种,debian系和redhat系的.现在国产的也有很多,例如优麒麟.以及安全操作系统凝思. debian系 redhat系 Debian RedHat |U…

k8s pod节点调度及k8s资源优化

一.k8s pod 在节点间调度控制 k8s起pod时,会通过调度器scheduler选择某个节点完成调度,选择在某个节点上完成pod创建.当需要在指定pod运行在某个节点上时,可以通过以下几种方式: 1. 在部署pod的yaml中,指定nodeName 指定了nodeName的Pod会直接跳过Scheduler的调度逻辑,直接写入PodList列表,该匹配规则是强制匹配.eg:apiVersion: extensions/v1beta1kind: Deploymentmetadata: nam…

k8s资源对象及API群组

REST是representational state transfer的缩写,意为“表征状态转移”,它是一种程序架构风格,基本元素为资源(resource).表征(representation)和行为(action). 资源可以分组为集合(collection),每个集合只包含单一类型的资源,并且各资源间是无序的.资源也可以部署于任何集合,它们称为单体资源.事实上,集合本身也是资源,它可以部署于全局级别,位于api的顶层,也可以包含于某个资源中,表现为“子集合”. k8s系统将一切事物都抽象为…

2.k8s资源清单

一.常见资源对象常见的资源对象:(包括但不仅限于) l Workload: Pod,ReplicaSet,Deployment,StatefulSet,DaemonSet,Job,Cronjob l 服务发现及均衡:Service,Ingress…… l 配置与存储:Volume,CSI(扩展第三方存储的接口) ConfigMap,Secret DownwardAPI l 集群级资源:Namespace,Node,Role,ClusterRole,RoleBinding,Cluster…

1.k8s.资源清单

#k8s常用资源工作负载:Pod,rs(ReplicasSet),deploy(Deployment),sts(StatefulSet),ds(DaemonSet),Job,Cronjob 服务发现及负载均衡:svc(Service), ing(Ingress) 配置与存储:Volume,pv( persistentvolumes ),pvc,cm(ConfigMap),Secret,DownwardAPI 集群级: ns(Namespace),Node,Role,ClusterRole,Ro…

K8S 资源收集和展示 top & DashBoard-UI

一.前言在近期的 K8S 开发调试的过程中,总会想知道 Node 或者 Pod 的更多信息.但 $ kubectl top node $ kubectl top pod 中的 top 操作符,需要 metrics 服务的支持. 同理,DashBoard-UI 也需要通过 metrics 获得资源使用状态. 所以,盘他没商量... 二.版本介绍 OS_VERSION = 'Ubuntu-16.04-amd64' DOCKER_VERSION = '18.06.3ce3-0~ubuntu' K8S…

看得见的成本！1款工具实现K8S资源成本监控可视化

本文来自Rancher Labs 关注我们,第一时间获取技术干货计算Kubernetes成本的复杂性采用Kubernetes和基于服务的架构可以为企业带来诸多好处,如团队可以更快地迁移以及应用程序可以更轻松地扩展等.但是这一转变也带来了一些复杂性,比如云成本的可见性.这是由于应用程序及其资源需求常常是动态变化的,并且团队共享核心资源而没有与工作负载挂钩的透明价格.此外,能够充分意识到Kubernetes所带来的优势的企业通常会将资源运行在不同类型的机器上,甚至会运行在多个云提供程序上. 在本…

容器编排系统之K8s资源标签、标签选择器、资源注解

前文我们聊到了使用k8s资源配置清单定义资源的相关话题,回顾请参考https://www.cnblogs.com/qiuhom-1874/p/14132890.html:今天我们来聊下资源标签,标签选择器以及资源注解相关话题: 1.标签和标签选择器对于pod来讲,我们知道使用pod控制器创建的pod在pod故障以后,重建后的pod它的ip地址和名称是变化的,为了解决pod访问问题,我们特此创建了service,我们访问service的ip地址就可以正常访问到pod:那么问题来了,service…

如何高效掌控K8s资源变化？K8s Informer实现机制浅析

作者王成,腾讯云研发工程师,Kubernetes contributor,从事数据库产品容器化.资源管控等工作,关注 Kubernetes.Go.云原生领域. 概述进入 K8s 的世界,会发现有很多的 Controller,它们都是为了完成某类资源(如 pod 是通过 DeploymentController, ReplicaSetController 进行管理)的调谐,目标是保持用户期望的状态. K8s 中有几十种类型的资源,如何能让 K8s 内部以及外部用户方便.高效的获取某类资源的变化…

K8s 资源配额管理对象 ResourcesQuota

Kubernetes 是一个多租户平台,更是一个镜像集群管理工具.一个 Kubernetes 集群中的资源一般是由多个团队共享的,这时候经常要考虑的是如何对这个整体资源进行分配.在 kubernetes 中提供了 Namespace 来讲应用隔离,那么是不是也能将资源的大小跟 Namespace 挂钩进行一起隔离呢?这当然是可以的,Kubernetes 提供了 Resources Quotas 工具,让集群管理员可以创建 ResourcesQuota 对象管理这个集群整体资源的配额,它可以限制某…

机器学习：保序回归(IsotonicRegression)：一种可以使资源利用率最大化的算法

1.数学定义保序回归是回归算法的一种,基本思想是:给定一个有限的实数集合,训练一个模型来最小化下列方程: 并且满足下列约束条件: 2.算法过程说明从该序列的首元素往后观察,一旦出现乱序现象停止该轮观察,从该乱序元素开始逐个吸收元素组成一个序列,直到该序列所有元素的平均值小于或等于下一个待吸收的元素. 举例: 原始序列:<9, 10, 14> 结果序列:<9, 10, 14> 分析:从9往后观察,到最后的元素14都未发现乱序情况,不用处理. 原始序列:<9, 14, 10&…

【智能 Request 推荐，K8s 资源利用率提升 252%】的更多相关文章