1、创建一个pod的工作流程

master节点组件

1、apiserver  --> etcd

2、scheduler

3、controller-manager

node节点有那些组件

1、kubelet

2、proxy

3、docker

执行kubectl apply -f pod.yaml 会执行的内容

1、kubectl将yaml内容转换成json，提交给apiserver，apiserver将数据存储在etcd中

2、scheduler会监听到创建新pod事件，根据pod属性调度到指定节点，并且给pod打个标签具体是那个节点

3、apiserver拿到调度的结算结果并写到etcd中

4、kubelet从apiserver获取分配到那台节点上

5、kubelet根据调用docker sock创建容器

6、docker根据kubelet需求创建完容器后将容器状态返回给kubelet

7、kubelet会将pod状态更新到apiserver

8、apiserver将状态数据写入到etcd

9、kubectl get pods

2、Pod中影响调度的主要属性　　

resources:{}         #资源调度依据

schedulerName: default-scheduler  #默认是不需要改

nodeName: ""         #根据节点名称进行调度

nodeSelector:{}      #根据节点的标签进行调度

affinity: {}         #亲和性

tolerations: []      #污点

3、资源限制对pod调度的影响

pod和container的资源请求和限制

spec.containers[].resources.limits.cpu       #CPU最大使用的资源

spec.containers[].resources.limits.memory    #内存最大使用的的资源

spec.containers[].resources.requests.cpu     #CPU使用量配置

spec.containers[].resources.requests.memory  #内存使用量配置

不指定这个两个值，pod可以使用宿主机的所有资源，时间长可能会造成雪崩效应

requests  #资源配额，配置启动需要的资源大小

limits    #最大限制，如果不指定，会使用宿主机全部资源

requests  #资源配额超出了所有机器可以分配的资源会创建失败

CPU单位：　　

2000m = 2核

1000m = 1核

500m  = 0.5核

100m  = 0.1核

k8s会根据Request的值去找有足够资源的node来调度此pod

例如：

cat deployment.yaml

apiVersion: apps/v1

kind: Deployment

metadata:

  name: web2

spec:

  replicas: 1

  selector:

    matchLabels:

      project: demo

      app: java

  template:

    metadata:

      labels:

        project: demo

        app: java

    spec:

      containers:

      - name: web

        image: lizhenliang/java-demo

        ports:

        - containerPort: 8080

        resources:

          requests:         #资源配额，启动需要多少资源

            cpu: 500m

            memory: 500mi   #资源调度的依据

          limits:           #最大使用配置

            cpu: 1

            memory: 600mi

生效配置

kubectl apply -f deployment.yaml

查询节点资源分配详细情况，可用和已用，pod运行时间等

kubectl describe node node-1

4、nodeSelector & nodeAffinity 　

nodeSelector 用于将pod调度到匹配的Label的node上

给节点打标签

kubectl label nodes [node] key=value

kubectl label nodes node-1 disktype=ssd  #给节点打标签

kubectl get node --show-labels           #查看节点的标签

kubectl get pods --show-labels           #查看pod的标签

kubectl get svc --show-labels            #查看svc的标签

例子：

给node-1节点打标签

kubectl label nodes node-1 disktype=ssd

编写清单文件

cat nodeselector.yaml

apiVersion: v1

kind: Pod

metadata:

  name: my-pod

spec:

  nodeSelector:

    disktype: "ssd"  #根据标签进行调度，之后调度到有ssd这个标签的机器上

  containers:

  - name: web

    image: lizhenliang/nginx-php

nodeAffinity:节点亲和类似与nodeSelector

nodeAffinity:节点亲和类似与nodeSelector可根据节点数的标签来约束pod可用调度到那些节点。

nodeAffinity相比nodeSelector:

1、匹配有更多的逻辑组合，不只是字符串的完全相等

2、调度分软策略和硬策略，而不是硬性要求

硬(required)：必须满足
软(preferred)：尝试满足

操作符：ln、Notln、Exists、DoesNotExist、Git、Lt

例如：

cat nodeaffinity.yaml

apiVersion: v1

kind: Pod

metadata:

  name: with-node-affinity

spec:

  affinity:

    nodeAffinity:

      requiredDuringSchedulingIgnoredDuringExecution:

        nodeSelectorTerms:

        - matchExpressions:

          - key: disktype

            operator: In

            values:

            - ssd

  containers:

  - name: with-node-affinity

    image: nginx

5、Taint（污点）　

5.1、Taints：避免pod调度到特定的node上

应用场景：

l 专用节点，例如配置了特殊硬件的节点

l 基于Taint的驱逐　　

设置污点

kubectl taint node [node] key=value:Noschedule/PerferNoSchedule/NoExecute 三选一

# 设置node-1污点

kubectl taint node node-1 gpu=yes:Noschedule

查看污点

kubectl describe node | grep Taint

去除污点

kubectl taint node [node] key:effect

kubectl taint node node-2 gpu

其中[effect]可取值

1、Noschedule：一定不能被调度

2、PerferNoSchedule：尽量不要调度

3、NoExecute：不仅不会调度，还会驱逐node上已有的pod

5.2、Tolerations （容忍污点）

Tolerations：允许pod调度到持有Taints的节点上

例如：

cat tolerations.yaml

apiVersion: apps/v1

kind: Deployment

metadata:

  labels:

    app: web

  name: web2

spec:

  replicas: 1

  selector:

    matchLabels:

      app: web

  strategy: {}

  template:

    metadata:

      labels:

        app: web4

    spec:

      tolerations:

      - key: "gpu"

        operator: "Equal"

        value: "yes"

        effect: "NoSchedule"

      containers:

      - image: nginx

        name: nginx

　生效清单文件

kubectl apply -f tolerations.yaml

注意：污点和污点容忍主要是在控制器节点跑特定的pod，如果不配置污点容忍，部署的Pod就不会分配在有污点的节点，也有几率分配到没有污点的节点

6、NodeName

nodeName：用于将Pod调度到指定节点上，不经过调度器scheduler

应用场景：调度器出问题了，无法实现调度，需要指定到指定的节点上

例子：

cat nodename.yaml

apiVersion: apps/v1

kind: Deployment

metadata:

  labels:

    app: web

  name: web2

spec:

  replicas: 1

  selector:

    matchLabels:

      app: web

  strategy: {}

  template:

    metadata:

      labels:

        app: web4

    spec:

      nodeName: node-2

      containers:

      - image: nginx

        name: nginx

7、DaemonSet控制器

DaemonSet功能

1、在每个node上运行一个pod

2、新加入的Node也同样会自动运行一个pod

   应用场景：网络插件、监控、agent、日志收集agent

注意：会受污点的影响，有污点的节点不会创建pod

配置容忍污点部署daemonset才会在每个节点上创建pod

例子：

cat daemonset.yaml

apiVersion: apps/v1

kind: DaemonSet

metadata:

  name: web3

spec:

  selector:

    matchLabels:

      project: demo

      app: java

  template:

    metadata:

      labels:

        project: demo

        app: java

    spec:

      tolerations:

        - key: gpu

          operator: Equal

          value: "yes"

          effect: "NoSchedule"

        - key: node-role.kubernetes.io/master

          effect: NoSchedule

      containers:

      - name: web

        image: lizhenliang/java-demo

调度失败原因的分析　　

查看调度结果：

kubectl get pod <podname> -o wide

查看调度失败原因：

kubectl deacribe pod <podname>

1、节点CPU、内存不足

2、有污点、没有容忍

3、没有匹配到节点标签

容器处于pending状态　　

1、正在下载镜像

2、CPU不足： 0/3 nodes are available: 3 Insufficient cpu.

3、没有匹配标签的节点：0/3 nodes are available: 3 node(s) didn't match node selector

4、没有污点容忍：0/3 nodes are available: 1 node(s) had taint {disktype: ssd}, that the pod didn't tolerate, 1 node(s) had taint {gpu: yes}, that the pod didn't tolerate, 1 node(s) had taint {node-role.kubernetes.io/master: }, that the pod didn't tolerate.

5-kunernetes资源调度的更多相关文章

[大数据之Yarn]——资源调度浅学
在hadoop生态越来越完善的背景下,集群多用户租用的场景变得越来越普遍,多用户任务下的资源调度就显得十分关键了.比如,一个公司拥有一个几十个节点的hadoop集群,a项目组要进行一个计算任务,b项目 ...
架构从最简单的数据访问框架(ORM)到资源调度和治理中心(SOA)说起
随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在必行,亟需一个治理系统确保架构有条不紊的演进. 单一应用架构当网站流量很小时,只需一个应用,将 ...
YARN资源调度器
YARN资源调度器转载请注明出处:http://www.cnblogs.com/BYRans/ 概述集群资源是非常有限的,在多用户.多任务环境下,需要有一个协调者,来保证在有限资源或业务约束下有序 ...
YARN应用场景、原理与资源调度
1.Hadoop YARN产生背景源于MapReduce1.0 运维成本如果采用“一个框架一个集群”的模式,则可能需要多个管理员管理这些集群,进而增加运维成本,而共享模式通常需要少数管理员即可完成 ...
Spark系列(七)Master中的资源调度
资源调度说明: Application的调度算法有两种,分别为spreadOutApps和非spreadOutApps spreadOutApps 在spark-submit脚本中,可以指定要多少个 ...
Spark Executor Driver资源调度小结【转】
一.引子在Worker Actor中,每次LaunchExecutor会创建一个CoarseGrainedExecutorBackend进程,Executor和CoarseGrainedExecut ...
yarn资源调度（网络搜集）
本文转自:http://www.itweet.cn/2015/07/24/yarn-resources-manager-allocation/ Hadoop YARN同时支持内存和CPU两种资源的调度 ...
Spark Executor Driver资源调度汇总
一.简介于Worker Actor于,每次LaunchExecutor这将创建一个CoarseGrainedExecutorBackend流程.Executor和CoarseGrainedExecu ...
Spark Core_资源调度与任务调度详述
转载请标明出处http://www.cnblogs.com/haozhengfei/p/0593214ae0a5395d1411395169eaabfa.html Spark Core_资源调度与任务 ...
[Spark内核] 第31课：Spark资源调度分配内幕天机彻底解密：Driver在Cluster模式下的启动、两种不同的资源调度方式源码彻底解析、资源调度内幕总结
本課主題 Master 资源调度的源码鉴赏 [引言部份:你希望读者看完这篇博客后有那些启发.学到什么样的知识点] 更新中...... 资源调度管理任务调度与资源是通过 DAGScheduler.Ta ...

随机推荐

rpc之负载均衡
使用集群,比如zk来控制注册中心,当一个服务有多个请求地址的时候,会返回多个地址. 那么就需要负载均衡来控制我们要请求哪台机器来得到请求. 方案一:随机传入key值和key所包含的ip地址值,该地址 ...
ctf常见源码泄露
前言在ctf中发现很多源码泄露的题,总结一下,对于网站的搭建要注意删除备份文件,和一些工具的使用如git,svn等等的规范使用,避免备份文件出现在公网 SVN源码泄露原理 SVN(subversi ...
条件竞争(race condition)
条件竞争漏洞是一种服务器端的漏洞,由于服务器端在处理不同用户的请求时是并发进行的,因此,如果并发处理不当或相关操作逻辑顺序设计的不合理时,将会导致此类问题的发生. 参考了一些资料,发现一个比较能说明问 ...
Oracle12C配置对外访问
Oracle12C配置对外访问第一步: 开放端口或者关闭防火墙第二步: 配置Oracle net manager打开Net manager 修改为共享服务器第三步: 配置连接数打开Databas ...
20190923-09Linux磁盘分区类 000 017
df 查看磁盘空间使用情况 df: disk free 空余硬盘 1．基本语法 df 选项 (功能描述:列出文件系统的整体磁盘使用量,检查文件系统的磁盘空间占用情况) 2．选项说明表1-32 选项 ...
db2错误代码可能的原因
一. SQL5005C运行cmd未用管理员权限打开 SQLCODE-303 数据类型不兼容 SQLCODE-305 查出的数据有NULL未处理直接写入接收变量二.应该不会有人直接写sql用这个 ...
【源码讲解】Spring事务是如何应用到你的业务场景中的？
初衷日常开发中经常用到@Transaction注解,那你知道它是怎么应用到你的业务代码中的吗?本篇文章将从以下两个方面阐述Spring事务实现原理: 解析并加载事务配置:本质上是解析xml文件将标签 ...
吴恩达《深度学习》-课后测验-第一门课 (Neural Networks and Deep Learning)-Week 3 - Shallow Neural Networks（第三周测验 - 浅层神经网络）
Week 3 Quiz - Shallow Neural Networks(第三周测验 - 浅层神经网络) \1. Which of the following are true? (Check al ...
Scala的对字符串应用
1.trimEnd:截取末尾几个长度的字符串 import scala.collection.mutable.ArrayBuffer val a = ArrayBuffer[Int]() a+=(1, ...
用华为HMS ML kit人体骨骼识别技术，Android快速实现人体姿势动作抓拍 
你有没有过这种体验,拍照时对着镜头,脑子一片空白.表情僵硬.手和脚无处安放,最后拍出来的照片很是奇怪.拍照软件中的固定姿势抓拍功能可以帮助你:选择一个你想要的姿势模板,当你摆出同款姿势时,软件会进 ...

5-kunernetes资源调度