本文分享自华为云社区《基于volcano实现节点真实负载感知调度》，作者：可以交个朋友。

背景

默认调度器调度器视某个节点的空闲可调度资源=节点可分配资源 - SUM(节点上已调度Pod们的request),当某个Pod处于pending状态待调度时，默认调度器根据Pod中指定的request值和各个节点的空闲可调度资源比较，如果某个节点空闲可调度资源 < pod的request值，则节点不可被调度，反之则可能被调度。

从这里可以看出，默认调度主要是依据各个pod创建时设置的request值，可能导致：

业务实际负载需要的资源远大于创建时指定的request值，导致节点部署过密，影响业务运行稳定性；
业务实际负载需要的资源小于创建时候指定的request值，导致节点部署稀疏，造成资源浪费

基于volcano节点真实负载感知调度方案介绍

默认调度器基于上述调度策略的主要原因是，k8s自己没有真实去获取节点真实资源消耗，导致无法实现更合理的节点的空闲可调度资源=节点可分配资源 - 节点真实资源使用。开源Prometheus可以获取到各个节点的真实负载情况，基于volcano调度插件的能力可以实现基于应用能够基于真实负载调度，在资源满足的情况下，Pod优先被调度至真实负载低的节点，集群各节点负载趋于均衡。

CCE集群开启负载感知调度

限制

已创建v1.21及以上版本的集群

已安装Volcano 1.11.14及以上版本的插件

已安装CCE云原生监控插件（kube-prometheus-stack），并选择server模式

开启负载感知调度

安装Volcano调度器、云原生监控插件（安装server模式，agent模式没有custom-metrics API）

集群通过Custom Metrics API提供资源指标，修改adapter-config的configMap，添加自定义指标采集规则。配置项与密钥->命名空间选择 “monitoring” ->找到user-adapter-config 点击 “更新”

编辑->添加新规则

- seriesQuery: '{__name__=~"node_cpu_seconds_total"}'

    resources:

      overrides:

        instance:

          resource: node

    name:

      matches: node_cpu_seconds_total

      as: node_cpu_usage_avg

    metricsQuery: avg_over_time((1 - avg (irate(<<.Series>>{mode="idle"}[5m])) by (instance))[10m:30s])

  - seriesQuery: '{__name__=~"node_memory_MemTotal_bytes"}'

    resources:

      overrides:

        instance:

          resource: node

    name:

      matches: node_memory_MemTotal_bytes

      as: node_memory_usage_avg

    metricsQuery: avg_over_time(((1-node_memory_MemAvailable_bytes/<<.Series>>))[10m:30s])

CPU平均利用率采集规则

node_cpu_usage_avg：表示节点的CPU平均利用率，该指标名不可修改。

metricsQuery: avg_over_time((1 - avg (irate(<<.Series>>{mode=“idle”}[5m])) by (instance))[10m:30s])：为节点CPU平均利用率的查询语句。当前metricsQuery表示查询所有节点最近10分钟的CPU平均利用率，如果希望调整平均值的计算周期，可以修改上述标红的10m。(30s是分辨率)

Memory平均利用率采集规则：

node_memory_usage_avg：表示节点的Memory利用率，该指标名不可修改。

metricsQuery:avg_over_time(((1-node_memory_MemAvailable_bytes/<<.Series>>))[10m:30s]) 为节点Memory平均利用率的查询语句。

当前metricsQuery表示查询所有节点最近10分钟的Memory平均利用率，如果希望调整平均值的计算周期为，可以修改上述标红的10m。(30s是分辨率)

新部署metrics-api-server负载，使其加载user-adapter-config的最新配置

开启负载感知调度能力。配置中心->调度配置->默认调度器”volcano”->资源利用率优化调度->支持负载感知调度

说明：

负载感知调度根据CPU、Memory真实负载信息对节点进行打分排序，优先选择负载更低的节点参与调度。

如果我们更偏向于将负载调度到cpu真实负载低的节点，或内存真实负载低的节点，可以通过调整权重来影响节点打分，负载优先选择得分最高的节点参与调度

节点打分公式：

节点得分=负载感知策略权重 *（（1 - CPU资源利用率） * CPU权重 + （1 - Memory资源利用率） * 内存权重）/（CPU权重 + 内存权重）

真实负载阈值，从CPU和内存两方面限制节点真实负载的水位，防止节点压力过高，真实负载阈值的生效方式分为“软约束“和“硬约束“

软约束：节点 CPU、内存真实负载达到阈值后，新的任务优先被分配至真实负载未达到阈值的节点，但是该节点依然允许调度。

硬约束：节点 CPU、内存真实负载达到阈值后，该节点不允许调度新的任务。

效果验证

环境准备

创建1个负载 cpu：request 0.1 limit 6，使其调度在 “192.168.64.81” 这个节点上，节点CPU request的分配率：42.48% 实际占用率 76.9%

创建1个负载 cpu：request 4 limit 4，使其调度在 “192.168.64.219” 这个节点上，节点CPU request的分配率：91.15% 实际占用率 1.4%

验证未开启负载感知调度时，新建负载的调度情况

创建1个负载，CPU request 0.1 limit 0.1 内存 request 100MiB limit 100MiB

查看工作负载的调度情况，发现负载调度到了cpu request分配率低，但是实际CPU占用率高的节点 “192.168.64.81” 上

再添加1个副本，仍然调度到"192.168.64.81"上

验证开启负载感知调度时，新建负载的调度情况

开启负载感知调度，CPU 真实负载阈值设置为70% 硬约束

创建1个负载，CPU request 0.1 limit 0.1 内存 request 100MiB limit 100MiB

信息填写完整后，点击右上角yaml创建，添加一行shcedulerName: volcano

查看工作负载调度情况，发现负载调度到了cpu request分配率高，但是实际CPU占用率低的节点 “192.168.64.219” 上

再添加1个副本，仍然调度在节点 “192.168.64.219” 上

点击关注，第一时间了解华为云新鲜技术~

基于volcano实现节点真实负载感知调度的更多相关文章

Crane-scheduler：基于真实负载进行调度
作者邱天,腾讯云高级工程师,负责腾讯云 TKE 动态调度器与重调度器产品. 背景原生 kubernetes 调度器只能基于资源的 resource request 进行调度,然而 Pod 的真实资 ...
HAProxy详解（三）：基于虚拟主机的HAProxy负载均衡系统配置实例【转】
一.基于虚拟主机的HAProxy负载均衡系统配置实例 1.通过HAProxy的ACL规则配置虚拟主机: 下面将通过HAProxy的ACL功能配置一套基于虚拟主机的负载均衡系统.这里操作系统环境为:Ce ...
基于开源Tars的动态负载均衡实践
一.背景 vivo 互联网领域的部分业务在微服务的实践过程当中基于很多综合因素的考虑选择了TARS微服务框架. 官方的描述是:TARS是一个支持多语言.内嵌服务治理功能,与Devops能很好协同的微服 ...
基于Nginx反向代理及负载均衡
基于Nginx反向代理及负载均衡参考:http://nginx.org/en/docs/http/ngx_http_proxy_module.html#proxy_pass 只要没有被启用,默认就是 ...
90-95年CPU功耗感知调度研究
最近读了三篇1990-1995年的通过调度来降低cpu能耗的文章[1] [2] [3],简单总结一下该年代单核CPU功耗感知的调度策略. Motivation 随着便携式设备逐渐兴起,人们对降低其功耗 ...
Go 语言开发的基于 Linux 虚拟服务器的负载平衡平台 Seesaw
负载均衡系统 Seesaw Seesaw是由我们网络可靠性工程师用 Go 语言开发的基于 Linux 虚拟服务器的负载平衡平台,就像所有好的项目一样,这个项目也是为了解决实际问题而产生的. Seesa ...
反向代理负载均衡调度：nginx
一.概述反向代理:以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个 ...
Ignite集群管理——基于Zookeeper的节点发现
Ignite支持基于组播,静态IP,Zookeeper,JDBC等方式发现节点,本文主要介绍基于Zookeeper的节点发现. 环境准备,两台笔记本电脑A,B.A笔记本上使用VMware虚拟机安装了U ...
基于Apache和tomcat实现负载均衡
1.基于Apache和tomcat实现负载均衡准备三个虚拟机一个安装Apache两个安装Tomcat 关闭防火墙 systemctl stop firewalld Iptabled -F Seten ...
Kubernetes K8S之固定节点nodeName和nodeSelector调度详解
Kubernetes K8S之固定节点nodeName和nodeSelector调度详解与示例主机配置规划服务器名称(hostname) 系统版本配置内网IP 外网IP(模拟) k8s-mas ...

随机推荐

【JAVA基础】数值处理
#BigDecimal处理 ##保留两位小数 https://www.cnblogs.com/jpfss/p/8072379.html /** * 保留两位小数 */ @org.junit.Test ...
Codeforces Round #650 (Div. 3) F1经典离散化DP
比赛链接:Here 1367A. Short Substrings Description 一个字符串 abac,然后把所有长度为2的子串加起来变成新串,abbaac,由 ab ba ac组成.现在给 ...
AtCoder Beginner Contest 208 A~E个人题解
比赛链接:Here A - Rolling Dice 水题一个六面的骰子,请问摇动 \(A\) 次最后的点数和能否为 \(B\) 如果 \(B \in [a,6a]\) 输出 YES C++ voi ...
Synchronized的使用及原理总结
本文为博主原创,未经允许不得转载 Synchronized的使用总结: 1.作用原理 synchronized 的锁膨胀升级过程对象的内存布局锁的消除及逃逸分析 synchronized的方 ...
git添加被.gitignore忽略的文件
技术背景在git操作中,有时候为了保障线上分支的简洁性,会在.gitignore文件中屏蔽一些关键词,比如可以加一个*.txt来屏蔽掉项目中所有带txt后缀的文件,还可以加上*test*来屏蔽所有的 ...
Laravel路由匹配
Route常规用法如下,特别是最后一个传参之后可以进行正则匹配,非常好用. //@后面内容为所要访问的方法 Route::get('foo', 'Photos\AdminController@meth ...
unix domain 与本地本地回环在进程间通信中的差异
前言: 127.0.0.1它是一个私有IP,代表的就是你的本机环回地址,其实本质上是绑定在虚拟网卡loopback上的IP. 在实际应用中,有遇到在使用本地回环做进程间通讯的时候程序阻塞的情况.比如下 ...
汉字在unicode的编码情况-From http://yedict.com/zsts.htm
字符集内容字数 unicode编码字符显示说明(除非安装更大字库) 基本区分页: 一二三四共20902字 4E00-9FA5 电脑和手机都能显示基本区补充共90字 9FA6-9F ...
[转帖]python字符串如何删除后几位
https://www.python51.com/jc/15070.html 1.首先在jupyter notebook中新建一个空白的python文件: 2.然后定义一个字符串,用字符串截取的方式打 ...
[转帖]xargs详解
https://www.cnblogs.com/xiaofeng666/p/10800939.html xargs与find经常结合来进行文件操作,平时删日志的时候只是习惯的去删除,比如 # find ...

基于volcano实现节点真实负载感知调度

背景