05-k8s调度器、预选策略、优选函数
k8s调度器、预选策略、优选函数
节点选择过程
- 节点预选过程(predicate)
- 优选过程(priority)
- 选定节点(select)
调度器
预选策略
CheckNodeCondition:检查节点是否正常
GeneralPredicates:
- Hostname:检查pod对象是否定义了pod.spec.host
- PodFitsHostPorts:检查pod对象的 pod.spec.containers.ports.hostport
- MatchNodeSelector:检查pod.spec.nodeSelector
- PodFitsResources:检查pod对资源的需求能否被资源满足
(默认不启用)NoDiskConflict:检查pod依赖的存储卷 是否能满足需求
PodToleratesNodeTains: 检查污点与容忍。pod.spec.tolerations
(默认不启用)PodToleratesNodenoExcuteTains:驱离污点
(默认不启用)checkNodeLabelPresence:检查标签的存在性
(默认不启用)checkServiceAffinity:将 同一个service 下的pod 尽可能放在一个Node下
MaxEBSVolumeCount
MaxGCEPDVolumeCount
MaxAzureDiskVolumeCount
CheckVolumeBinding:
NoVolumeZoneConflict:
CheckNodeMemoryPressure: 检查内存压力
CheckNodePIDPressure:检查进程压力
CheckNodeDiskPressure
MatchInterPodAffitnity: pod间的亲和性
优选函数
https://github.com/kubernetes/kubernetes/tree/master/pkg/scheduler/algorithm/priorities
- LeastRequested:按照资源使用量得分
- BalancedResourceAllocation : CPU和内存资源占用率相近的胜出。平衡资源使用情况
- NodePreferAvoidPods:根据节点的注解信息 "scheduler.aplpha.kubernetes.io/preferAvoidPods" Node 倾向于不
- TainToleration:将pod对象的spec.tolerations 与node的Tain进行匹配度检查,匹配的条目越多,得分越低。
- SelectorSpreading:尽可能的将相同标签选择器的pod 分散在不同的node上。
- InterPodAffinity:亲和性匹配项
- nodeAffinity:节点亲和性
- (默认不启用)MostRequested:服务器空闲度越低,越优先
- (默认不启用)NodeLabel:根据node标签评分
- (默认不启用)imageLocality:节点上是否有需求的镜像,根据镜像的体积大小之和计算
根据预选与优选 影响pod 的节点选择,主要可以通过污点、pod亲和性、node亲和性。
高级调度设置机制
- 节点选择器/节点亲和调度:nodeSelector, nodeName, nodeAffinity
node选择器/node亲和调度
- nod.spec.nodeName : 根据node 名称选择
- nod.spec.nodeSelector:根据node 的标签进行选择
强约束,条件不满足则pedding
- pod.spec.affinity.nodeAffinity
- preferredDuringSchedulingIgnoredDuringExecution 非强制性 ,多条件权重
- requiredDuringSchedulingIgnoredDuringExecution 强制性
pod亲和性
- pod.spec.affinity.podAffinity
- preferredDuringSchedulingIgnoredDuringExecution 非强制性
- requiredDuringSchedulingIgnoredDuringExecution 强制性
- labelSelector
- namespace
- topologykey 必须的 affinity、anti-affinity
污点调度 Taints 与 Tolerations
Taints 给予node定义,那些pod可以执行
**pod 使用 Tolerations指定容忍的污点 **
node.spec.taints
FIELDS:
effect <string> -required-
Required. The effect of the taint on pods that do not tolerate the taint.
Valid effects are NoSchedule, PreferNoSchedule and NoExecute.
key <string> -required-
Required. The taint key to be applied to a node.
timeAdded <string>
TimeAdded represents the time at which the taint was added. It is only
written for NoExecute taints.
value <string>
Required. The taint value corresponding to the taint key.
effect: 用于定义排斥的行为:
- NoSchedule :仅仅影响调度过程,对已经存在的pod不产生影响。
- PreferNoSchedule:最好不调度,但是可容忍。
- NoExecute:既影响调度过程,也影响存在的pod对象。驱逐。
管理节点污点
kubectl taint NODE NAME KEY_1=VAL_1:TAINT_EFFECT_1 ... KEY_N=VAL_N:TAINT_EFFECT_N [options]
pod.spec.tolerations
可以让pod 容忍 node 上的污点。
FIELDS:
effect <string>
Effect indicates the taint effect to match. Empty means match all taint
effects. When specified, allowed values are NoSchedule, PreferNoSchedule
and NoExecute.
key <string>
Key is the taint key that the toleration applies to. Empty means match all
taint keys. If the key is empty, operator must be Exists; this combination
means to match all values and all keys.
operator <string>
Operator represents a key's relationship to the value. Valid operators are
Exists and Equal. Defaults to Equal. Exists is equivalent to wildcard for
value, so that a pod can tolerate all taints of a particular category.
tolerationSeconds <integer>
TolerationSeconds represents the period of time the toleration (which must
be of effect NoExecute, otherwise this field is ignored) tolerates the
taint. By default, it is not set, which means tolerate the taint forever
(do not evict). Zero and negative values will be treated as 0 (evict
immediately) by the system.
value <string>
Value is the taint value the toleration matches to. If the operator is
Exists, the value should be empty, otherwise just a regular string.
05-k8s调度器、预选策略、优选函数的更多相关文章
- k8s调度的预选策略及优选函数
scheduler调度过程: Predicate(预选)-->Priority(优选)-->Select(选定)调度方式: 1.节点亲和性调度(NodeAffinity)使用n ...
- 7.k8s.调度器scheduler 亲和性、污点
#k8s. 调度器scheduler 亲和性.污点 默认调度过程:预选 Predicates (过滤节点) --> 优选 Priorities(优先级排序) --> 优先级最高节点 实际使 ...
- golang中GPM模型原理与调度器设计策略
一.GMP模型原理first: 1. 全局队列:存放待运行的G2. P的本地队列:同全局队列类似,存放待运行的G,存储的数量有限:256个,当创建新的G'时,G'优先加入到P的本地队列,如果队列已满, ...
- K8S 调度器,预选策略,优选函数
Kubernetes Scheduler 提供的调度流程分三步: 预选策略(predicate) 遍历nodelist,选择出符合要求的候选节点,Kubernetes内置了多种预选规则供用户选择. 优 ...
- k8s调度器、预选策略及调度方式
一.k8s调度流程 1.(预选)先排除完全不符合pod运行要求的节点2.(优先)根据一系列算法,算出node的得分,最高没有相同的,就直接选择3.上一步有相同的话,就随机选一个 二.调度方式 1.no ...
- 图解kubernetes调度器预选设计实现学习
Scheduler中在进行node选举的时候会首先进行一轮预选流程,即从当前集群中选择一批node节点,本文主要分析k8s在预选流程上一些优秀的筛选设计思想,欢迎大佬们指正 1. 基础设计 1.1 预 ...
- k8s调度器kube-scheduler
kube-scheduler简介 调度是容器编排的重要环节,需要经过严格的监控和控制,现实生产通常对调度有各类限制,譬如某些服务必须在业务独享的机器上运行,或者从灾备的角度考虑尽量把服务调度到不同机器 ...
- 泡面不好吃,我用了这篇k8s调度器,征服了他
1.1 调度器简介 来个小刘一起 装逼吧 ,今天我们来学习 K8的调度器 Scheduler是 Kubernetes的调度器,主要的任务是把定义的 pod分配到集群的节点上,需要考虑以下问题: 公平: ...
- k8s调度器介绍(调度框架版本)
从一个pod的创建开始 由kubectl解析创建pod的yaml,发送创建pod请求到APIServer. APIServer首先做权限认证,然后检查信息并把数据存储到ETCD里,创建deployme ...
- golang中goroutine协程调度器设计策略
goroutine与线程 /* goroutine与线程1. 可增长的栈os线程一般都有固定的栈内存,通常为2MB,一个goroutine的在其声明周期开始时只有很小的栈(2KB),goroutine ...
随机推荐
- vsphere网络
物理网络 物理机间建立的网络,VMware ESXi运行于物理机之上 虚拟网络 单台物理机上运行的虚拟机之间通信形成的逻辑网络. 一.网络概述 1. 物理以太网交换机 2.vSphere标准交换机 虚 ...
- 系统学习 Java IO (四)----文件的读写和随机访问 FileInputStream/FileOutputStream & RandomAccessFile
目录:系统学习 Java IO---- 目录,概览 文件输入流 FileInputStream 这是一个简单的FileInputStream示例: InputStream input = new Fi ...
- CSS3之响应式布局及其应用
使用 Media 属性前需添加兼容移动设备优先代码 <meta name=”viewport”content=”width=device-width,initial-scale=1.0,maxi ...
- CSS3过渡与动画
一.CSS3 过渡 transition-property 规定过渡效果的 CSS 属性名 -webkit-transition-property: none / all / property; -m ...
- 前端笔记之React(四)生命周期&Virtual DOM和Diff算法&日历组件开发
一.React生命周期 一个组件从出生到消亡,在各个阶段React提供给我们调用的接口,就是生命周期. 生命周期这个东西,必须有项目,才知道他们干嘛的. 1.1 Mouting阶段[装载过程] 这个阶 ...
- linux上mysql MM(双主)架构及keepalived搭建
master1 10.1.1.14 VIP 10.1.1.16master2 10.1.1.15 VIP 10.1.1.16 一.mysql MM配置1.修改master1的my.cnf# vi /e ...
- 每天学点node系列-zlib
永不放弃,永不放弃又有两个原则,第一个原则是永不放弃,第二个原则就是:当你想放弃时回头看第一个原则. 概览 做过web性能优化的同学,对性能优化大杀器gzip应该不陌生.浏览器向服务器发起资源请求,比 ...
- 深入学习Spring框架(一)- 入门
1.Spring是什么? Spring是一个JavaEE轻量级的一站式开发框架. JavaEE: 就是用于开发B/S的程序.(企业级) 轻量级:使用最少代码启动框架,然后根据你的需求选择,选择你喜欢的 ...
- ORM的记录添加和删除
记录查询包括:跨表查询(重点), 分组查询,聚合查询, F与Q查询 查询之前需要先添加数据: 一对多添加: def addrecord(request): Book.objects.create( ...
- django基础知识之认识MVT MVC:
MVT Django是一款python的web开发框架 与MVC有所不同,属于MVT框架 m表示model,负责与数据库交互 v表示view,是核心,负责接收请求.获取数据.返回结果 t表示templ ...