k8s调度器、预选策略、优选函数

节点选择过程

  • 节点预选过程(predicate)
  • 优选过程(priority)
  • 选定节点(select)

调度器

预选策略

  • CheckNodeCondition:检查节点是否正常

  • GeneralPredicates:

    • Hostname:检查pod对象是否定义了pod.spec.host
    • PodFitsHostPorts:检查pod对象的 pod.spec.containers.ports.hostport
    • MatchNodeSelector:检查pod.spec.nodeSelector
    • PodFitsResources:检查pod对资源的需求能否被资源满足
  • (默认不启用)NoDiskConflict:检查pod依赖的存储卷 是否能满足需求

  • PodToleratesNodeTains: 检查污点与容忍。pod.spec.tolerations

  • (默认不启用)PodToleratesNodenoExcuteTains:驱离污点

  • (默认不启用)checkNodeLabelPresence:检查标签的存在性

  • (默认不启用)checkServiceAffinity:将 同一个service 下的pod 尽可能放在一个Node下

  • MaxEBSVolumeCount

  • MaxGCEPDVolumeCount

  • MaxAzureDiskVolumeCount

  • CheckVolumeBinding:

  • NoVolumeZoneConflict:

  • CheckNodeMemoryPressure: 检查内存压力

  • CheckNodePIDPressure:检查进程压力

  • CheckNodeDiskPressure

  • MatchInterPodAffitnity: pod间的亲和性

优选函数

https://github.com/kubernetes/kubernetes/tree/master/pkg/scheduler/algorithm/priorities

  • LeastRequested:按照资源使用量得分
  • BalancedResourceAllocation : CPU和内存资源占用率相近的胜出。平衡资源使用情况
  • NodePreferAvoidPods:根据节点的注解信息 "scheduler.aplpha.kubernetes.io/preferAvoidPods" Node 倾向于不
  • TainToleration:将pod对象的spec.tolerations 与node的Tain进行匹配度检查,匹配的条目越多,得分越低。
  • SelectorSpreading:尽可能的将相同标签选择器的pod 分散在不同的node上。
  • InterPodAffinity:亲和性匹配项
  • nodeAffinity:节点亲和性
  • (默认不启用)MostRequested:服务器空闲度越低,越优先
  • (默认不启用)NodeLabel:根据node标签评分
  • (默认不启用)imageLocality:节点上是否有需求的镜像,根据镜像的体积大小之和计算

根据预选与优选 影响pod 的节点选择,主要可以通过污点、pod亲和性、node亲和性。

高级调度设置机制

  • 节点选择器/节点亲和调度:nodeSelector, nodeName, nodeAffinity

node选择器/node亲和调度

  • nod.spec.nodeName : 根据node 名称选择
  • nod.spec.nodeSelector:根据node 的标签进行选择

强约束,条件不满足则pedding

  • pod.spec.affinity.nodeAffinity

    • preferredDuringSchedulingIgnoredDuringExecution 非强制性 ,多条件权重
    • requiredDuringSchedulingIgnoredDuringExecution 强制性

pod亲和性

  • pod.spec.affinity.podAffinity

    • preferredDuringSchedulingIgnoredDuringExecution 非强制性
    • requiredDuringSchedulingIgnoredDuringExecution 强制性
      • labelSelector
      • namespace
      • topologykey 必须的 affinity、anti-affinity

污点调度 Taints 与 Tolerations

Taints 给予node定义,那些pod可以执行

**pod 使用 Tolerations指定容忍的污点 **

node.spec.taints

FIELDS:
effect <string> -required-
Required. The effect of the taint on pods that do not tolerate the taint.
Valid effects are NoSchedule, PreferNoSchedule and NoExecute. key <string> -required-
Required. The taint key to be applied to a node. timeAdded <string>
TimeAdded represents the time at which the taint was added. It is only
written for NoExecute taints. value <string>
Required. The taint value corresponding to the taint key.

effect: 用于定义排斥的行为:

  • NoSchedule :仅仅影响调度过程,对已经存在的pod不产生影响。
  • PreferNoSchedule:最好不调度,但是可容忍。
  • NoExecute:既影响调度过程,也影响存在的pod对象。驱逐。

管理节点污点

 kubectl taint NODE NAME KEY_1=VAL_1:TAINT_EFFECT_1 ... KEY_N=VAL_N:TAINT_EFFECT_N [options]

pod.spec.tolerations

可以让pod 容忍 node 上的污点。

FIELDS:
effect <string>
Effect indicates the taint effect to match. Empty means match all taint
effects. When specified, allowed values are NoSchedule, PreferNoSchedule
and NoExecute. key <string>
Key is the taint key that the toleration applies to. Empty means match all
taint keys. If the key is empty, operator must be Exists; this combination
means to match all values and all keys. operator <string>
Operator represents a key's relationship to the value. Valid operators are
Exists and Equal. Defaults to Equal. Exists is equivalent to wildcard for
value, so that a pod can tolerate all taints of a particular category. tolerationSeconds <integer>
TolerationSeconds represents the period of time the toleration (which must
be of effect NoExecute, otherwise this field is ignored) tolerates the
taint. By default, it is not set, which means tolerate the taint forever
(do not evict). Zero and negative values will be treated as 0 (evict
immediately) by the system. value <string>
Value is the taint value the toleration matches to. If the operator is
Exists, the value should be empty, otherwise just a regular string.

05-k8s调度器、预选策略、优选函数的更多相关文章

  1. k8s调度的预选策略及优选函数

    scheduler调度过程:    Predicate(预选)-->Priority(优选)-->Select(选定)调度方式:    1.节点亲和性调度(NodeAffinity)使用n ...

  2. 7.k8s.调度器scheduler 亲和性、污点

    #k8s. 调度器scheduler 亲和性.污点 默认调度过程:预选 Predicates (过滤节点) --> 优选 Priorities(优先级排序) --> 优先级最高节点 实际使 ...

  3. golang中GPM模型原理与调度器设计策略

    一.GMP模型原理first: 1. 全局队列:存放待运行的G2. P的本地队列:同全局队列类似,存放待运行的G,存储的数量有限:256个,当创建新的G'时,G'优先加入到P的本地队列,如果队列已满, ...

  4. K8S 调度器,预选策略,优选函数

    Kubernetes Scheduler 提供的调度流程分三步: 预选策略(predicate) 遍历nodelist,选择出符合要求的候选节点,Kubernetes内置了多种预选规则供用户选择. 优 ...

  5. k8s调度器、预选策略及调度方式

    一.k8s调度流程 1.(预选)先排除完全不符合pod运行要求的节点2.(优先)根据一系列算法,算出node的得分,最高没有相同的,就直接选择3.上一步有相同的话,就随机选一个 二.调度方式 1.no ...

  6. 图解kubernetes调度器预选设计实现学习

    Scheduler中在进行node选举的时候会首先进行一轮预选流程,即从当前集群中选择一批node节点,本文主要分析k8s在预选流程上一些优秀的筛选设计思想,欢迎大佬们指正 1. 基础设计 1.1 预 ...

  7. k8s调度器kube-scheduler

    kube-scheduler简介 调度是容器编排的重要环节,需要经过严格的监控和控制,现实生产通常对调度有各类限制,譬如某些服务必须在业务独享的机器上运行,或者从灾备的角度考虑尽量把服务调度到不同机器 ...

  8. 泡面不好吃,我用了这篇k8s调度器,征服了他

    1.1 调度器简介 来个小刘一起 装逼吧 ,今天我们来学习 K8的调度器 Scheduler是 Kubernetes的调度器,主要的任务是把定义的 pod分配到集群的节点上,需要考虑以下问题: 公平: ...

  9. k8s调度器介绍(调度框架版本)

    从一个pod的创建开始 由kubectl解析创建pod的yaml,发送创建pod请求到APIServer. APIServer首先做权限认证,然后检查信息并把数据存储到ETCD里,创建deployme ...

  10. golang中goroutine协程调度器设计策略

    goroutine与线程 /* goroutine与线程1. 可增长的栈os线程一般都有固定的栈内存,通常为2MB,一个goroutine的在其声明周期开始时只有很小的栈(2KB),goroutine ...

随机推荐

  1. 转:Mongoose使用操作

    一般我们不直接用MongoDB的函数来操作MongoDB数据库 Mongose就是一套操作MongoDB数据库的接口.   连接数据库 // mongoose 链接var mongoose = req ...

  2. Spring Boot:整合JdbcTemplate

    综合概述 Spring对数据库的操作在jdbc上面做了更深层次的封装,而JdbcTemplate便是Spring提供的一个操作数据库的便捷工具.我们可以借助JdbcTemplate来执行所有数据库操作 ...

  3. github 上传更新代码(最简单的方法)

    1.首先你需要一个github账号,还没有的朋友先去注册一个吧! GitHub地址:https://github.com/ 我们使用git需要先安装git工具,这里给出下载地址,下载后一路直接安装即可 ...

  4. docker系列(五):网络通信

    1 引言 之前的几篇docker系列博客说的都是单个容器或者镜像的操作.但容器,作为一种简化的操作系统,又怎能不与机器或者容器相互协同工作呢,这就需要用到容器的网络功能.docker中提供了多种不同的 ...

  5. rm、shutdown、磁盘挂载、vi使用方法

    1. 系统管理文件 1.1 rm 文件与目录有关命令 删除命令 (慎用)    --- 数据是否备份了 rm === remove rm /oldboy/oldboy.txt  --- 删除文件 rm ...

  6. java基础知识总结(二)

    Java中的代码块 java中的代码块是用{}括起来的代码,进行一些功能的限定 静态代码块:在类第一次被初始化的是后执行,负责一些类的初始化操作,仅仅只执行一次 构造代码块:顾名思义,辅助构造器进行初 ...

  7. 统计学习方法9—EM算法

      EM算法是一种迭代算法,是一种用于计算包含隐变量概率模型的最大似然估计方法,或极大后验概率.EM即expectation maximization,期望最大化算法. 1. 极大似然估计   在概率 ...

  8. 驰骋工作流引擎-CCMobile与安卓、IOS集成过程中的问题与解决方案

    CCMobile与安卓.IOS集成过程中的问题与解决方案 前言: CCMobile(2019版本)是CCFlow&JFlow 的一款移动端审批的产品.系统基于mui框架开发,是一款可以兼容An ...

  9. Windows 应用容器化

    背景 在这个时间点,我们可能已经对 Linux 容器使用已经达到熟练掌握的程度,因为 Docker 与 Kubernetes 都是最早为 Linux 平台设计.当我们从容器这项技术中体会到种种收益,对 ...

  10. 【Aizu - 0118】Property Distribution

    -->Property Distribution 原文是日语,算了算了,直接上我大中华母语吧  Descriptions: 在H * W的矩形果园里有苹果.梨.蜜柑三种果树, 相邻(上下左右)的 ...