一.系统环境

服务器版本	docker软件版本	Kubernetes(k8s)集群版本	CPU架构
CentOS Linux release 7.4.1708 (Core)	Docker version 20.10.12	v1.21.9	x86_64

Kubernetes集群架构：k8scloude1作为master节点，k8scloude2，k8scloude3作为worker节点

服务器	操作系统版本	CPU架构	进程	功能描述
k8scloude1/192.168.110.130	CentOS Linux release 7.4.1708 (Core)	x86_64	docker，kube-apiserver，etcd，kube-scheduler，kube-controller-manager，kubelet，kube-proxy，coredns，calico	k8s master节点
k8scloude2/192.168.110.129	CentOS Linux release 7.4.1708 (Core)	x86_64	docker，kubelet，kube-proxy，calico	k8s worker节点
k8scloude3/192.168.110.128	CentOS Linux release 7.4.1708 (Core)	x86_64	docker，kubelet，kube-proxy，calico	k8s worker节点

二.前言

本文介绍pod的3个重启策略（Always、OnFailure 和 Never）和5个pod的状态（Pending，Running，Succeeded，Failed，Unknown）。

管理pod的前提是已经有一套可以正常运行的Kubernetes集群，关于Kubernetes(k8s)集群的安装部署，可以查看博客《Centos7 安装部署Kubernetes(k8s)集群》https://www.cnblogs.com/renshengdezheli/p/16686769.html

三.pod的重启策略

容器的重启策略：Pod 的 spec 中包含一个 restartPolicy 字段，其可能取值包括 Always、OnFailure 和 Never。默认值是 Always。restartPolicy 适用于 Pod 中的所有容器。restartPolicy 仅针对同一节点上 kubelet 的容器重启动作。当 Pod 中的容器退出时，kubelet 会按指数回退方式计算重启的延迟（10s、20s、40s、...），其最长延迟为 5 分钟。一旦某容器执行了 10 分钟并且没有出现问题，kubelet 对该容器的重启回退计时器执行重置操作。

restartPolicy字段表示pod的重启策略：pod里的容器的重启策略有Always, OnFailure,Never 。

Always：总是重启；
OnFailure：故障了就重启，sleep 10只是正常到期不是故障，所以不会重启；
Never：从不重启。

获取restartPolicy字段的解释说明：

[root@k8scloude1 pod]# kubectl explain pods.spec.restartPolicy

KIND:     Pod

VERSION:  v1

FIELD:    restartPolicy <string>

DESCRIPTION:

     Restart policy for all containers within the pod. One of Always, OnFailure,

     Never. Default to Always. More info:

     https://kubernetes.io/docs/concepts/workloads/pods/pod-lifecycle/#restart-policy

四.pod的生命周期

Pod 遵循一个预定义的生命周期，起始于 Pending 阶段，如果至少其中有一个主要容器正常启动，则进入 Running，之后取决于 Pod 中是否有容器以失败状态结束而进入 Succeeded 或者 Failed 阶段。

在 Pod 运行期间，kubelet 能够重启容器以处理一些失效场景。在 Pod 内部，Kubernetes 跟踪不同容器的状态并确定使 Pod 重新变得健康所需要采取的动作。

在 Kubernetes API 中，Pod 包含规约部分和实际状态部分。 Pod 对象的状态包含了一组 Pod 状况（Conditions）。如果应用需要的话，你也可以向其中注入自定义的就绪性信息。

Pod 在其生命周期中只会被调度一次。一旦 Pod 被调度（分派）到某个节点，Pod 会一直在该节点运行，直到 Pod 停止或者被终止。

Pod 阶段：Pod 的 status 字段是一个 PodStatus 对象，其中包含一个 phase 字段。Pod 的阶段（Phase）是 Pod 在其生命周期中所处位置的简单宏观概述。该阶段并不是对容器或 Pod 状态的综合汇总，也不是为了成为完整的状态机。

Pod 阶段的数量和含义是严格定义的。下面是 phase 可能的值：

取值	描述
Pending	Pod 已被 Kubernetes 系统接受，但有一个或者多个容器尚未创建亦未运行。此阶段包括等待 Pod 被调度的时间和通过网络下载镜像的时间。
Running	Pod 已经绑定到了某个节点，Pod 中所有的容器都已被创建。至少有一个容器仍在运行，或者正处于启动或重启状态。
Succeeded	Pod 中的所有容器都已成功终止，并且不会再重启。
Failed	Pod 中的所有容器都已终止，并且至少有一个容器是因为失败终止。也就是说，容器以非 0 状态退出或者被系统终止。
Unknown	因为某些原因无法取得 Pod 的状态。这种情况通常是因为与 Pod 所在主机通信失败。

如果某节点死掉或者与集群中其他节点失联，Kubernetes 会实施一种策略，将失去的节点上运行的所有 Pod 的 phase 设置为 Failed。

一般情况下，删除pod很慢，要等30秒才能删除pod

[root@k8scloude1 pod]# kubectl get pod

NAME    READY   STATUS             RESTARTS   AGE

nginx   1/1     Running            0          45m

pod1    1/2     CrashLoopBackOff   11         34m

#kubectl delete pod pod1 :删除很慢，要等30秒才能删除

[root@k8scloude1 pod]# kubectl delete pod pod1

pod "pod1" deleted

查看宽限时间，terminationGracePeriodSeconds：表示优雅的终止pod需要多长时间，默认是30s

[root@k8scloude1 ~]# kubectl explain pods.spec.terminationGracePeriodSeconds

KIND:     Pod

VERSION:  v1

FIELD:    terminationGracePeriodSeconds <integer>

DESCRIPTION:

     Optional duration in seconds the pod needs to terminate gracefully. May be

     decreased in delete request. Value must be non-negative integer. The value

     zero indicates stop immediately via the kill signal (no opportunity to shut

     down). If this value is nil, the default grace period will be used instead.

     The grace period is the duration in seconds after the processes running in

     the pod are sent a termination signal and the time when the processes are

     forcibly halted with a kill signal. Set this value longer than the expected

     cleanup time for your process. Defaults to 30 seconds.

修改terminationGracePeriodSeconds参数为0，可以立马删除pod

[root@k8scloude1 pod]# vim pod2.yaml 

#把terminationGracePeriodSeconds设置为0

[root@k8scloude1 pod]# cat pod2.yaml

apiVersion: v1

kind: Pod

metadata:

  creationTimestamp: null

  labels:

    run: pod1

  name: pod1

spec:

  terminationGracePeriodSeconds: 0

  containers:

  - image: nginx

    imagePullPolicy: IfNotPresent

    name: n1

    resources: {}

  - image: nginx

    imagePullPolicy: IfNotPresent

    command: ["sh","-c","sleep 10"]

    name: n2

    resources: {}

  dnsPolicy: ClusterFirst

  restartPolicy: Always

status: {}

[root@k8scloude1 pod]# kubectl apply -f pod2.yaml

pod/pod1 created

[root@k8scloude1 pod]# kubectl get pod

NAME    READY   STATUS    RESTARTS   AGE

nginx   1/1     Running   0          56m

pod1    2/2     Running   1          18s

#terminationGracePeriodSeconds: 0  参数为0之后，立马就删除pod了

[root@k8scloude1 pod]# kubectl delete pod pod1

pod "pod1" deleted

pod(四)：pod的重启策略和生命周期的更多相关文章

Spring学习手札（四）谈谈Spring Bean的生命周期及作用域
在Spring中,那些组成应用程序的主体以及由Spring IoC容器所管理的对象,被称之为Bean.Bean与应用程序中其他对象(比如自己创建类)的区别就是,Bean是由IoC容器创建于销毁的.在S ...
Pod 生命周期和重启策略
Pod 在整个生命周期中被系统定义为各种状态,熟悉 Pod 的各种状态对于理解如何设置 Pod 的调度策略.重启策略是很有必要的. Pod 的状态状态值描述 Pending API Server ...
k8s核心资源之namespace与pod污点容忍度生命周期进阶篇(四)
目录 1.命名空间namespace 1.1 什么是命名空间? 1.2 namespace应用场景 1.3 namespacs常用指令 1.4 namespace资源限额 2.标签 2.1 什么是标签 ...
Pod 的生命周期
上图展示了一个 Pod 的完整生命周期过程,其中包含 Init Container.Pod Hook.健康检查三个主要部分,接下来我们就来分别介绍影响 Pod 生命周期的部分: 首先在介绍 Pod ...
Kubernetes Pod 生命周期
一. Pod Hook Kubernetes 为我们提供了生命周期钩子,就是我们所说的Pod Hook,Pod Hook是由kubelet发起的,当容器中的进程启动前或者容器中的进程终止之前运行.这是 ...
k8s之pod与Pod控制器
k8s中最为重要的基础资源,pod,pod controller,service pod controller类型有多种需要向控制器赋值之后使用: kubectl命令使用 kubectk get no ...
创建策略(Creation Policy )和生命周期(Life Cycle)
前言在前面的介绍中我们已经知道:导入和导出的匹配成功需要ContractType,ContractName,Metadata都匹配,这里我们还要介绍一个新的东西:创建策略(creation poli ...
Activity 生命周期及其栈管理方式
Activity 生命周期 Android 系统用栈的形式管理 Activity , 当新的 Activity 被创建是, 会被放置到栈顶, 这个 Activity 会进入到运行状态, 而前一个 Ac ...
Akka（2）：Actor生命周期管理 - 监控和监视
在开始讨论Akka中对Actor的生命周期管理前,我们先探讨一下所谓的Actor编程模式.对比起我们习惯的行令式(imperative)编程模式,Actor编程模式更接近现实中的应用场景和功能测试模式 ...
Elasticsearch索引生命周期管理方案
一.前言在 Elasticsearch 的日常中,有很多如存储系统日志.行为数据等方面的应用场景,这些场景的特点是数据量非常大,并且随着时间的增长索引的数量也会持续增长,然而这些场景基本上只有 ...

随机推荐

使用 bat 注册 ocx 控件
注册新建 reg.bat cd /d %~dp0 regsvr32 ./xxx.ocx 反注册新建 unreg.bat cd /d %~dp0 regsvr32 /u ./xxx.ocx
Windows系统编译libhv带SSL，开启WITH_OPENSSL
需要开发一个https的服务,使用libhv来做,需要重新编译libhv,需要开启 WITH_OPENSSL,前面编译一直很顺利,但是打开VS生成动态库的时候,报错,找不到ssl相关的文件,看了官方的 ...
Mybatis实现增删改查
1.CRUD 1.1namespace namespace中的包名必须和Dao/mapper接口包名一致 1.2select 选择,查询语句 id:就是对应的namespace中的方法名 resul ...
js 按照字母进行分组
前言 js 按照字母进行分组的一个实例. 正文 var list = [ { 'name' : '张三', 'py' : 'zhnagsan' }, { 'name' : '李四', 'py' : ' ...
szfpga 详细：高云1N1开发板高云gowin软件使用教程
1.概述国产FPGA是最近几年起来的产品,具有性价比高特点.高云FPGA,大多用在LED,电机控制,PLC设备上. 高云1N1开发板采用GW1N-LV1QN48C6/I5 FPGA器件.具有低功 ...
初探Mysql架构和InnoDB存储引擎
前言 mysql相信大家都不陌生了,分享之前我们先思考几个面试题: 1.undo log和redo log了解过吗?它们的作⽤分别是什么? 2.redo log是如何保证事务不丢失的? 3.mysql ...
webkit简介
WebKit是一款开源的浏览器引擎,主要用于渲染HTML网页和执行JavaScript代码.WebKit起源于苹果公司,最初是为了开发Safari浏览器而创建的.现在,它已经成为许多浏览器(如苹果的S ...
剑指offer04(Java)二维数组中的查找（中等）
题目: 在一个 n * m 的二维数组中,每一行都按照从左到右非递减的顺序排序,每一列都按照从上到下非递减的顺序排序.请完成一个高效的函数,输入这样的一个二维数组和一个整数,判断数组中是否含有 ...
这是阿里技术专家对 SRE 和稳定性保障的理解
简介: 在技术工作中,对于产品/基础技术研发和 SRE 两种角色,通常会有基于「是否侧重编码」的理解.对于产品研发转做 SRE ,经常会产生是否要「脱离编码工作」的看法,或者认为是否要「偏离对产品/基 ...
AHPA：开启 Kubernetes 弹性预测之门
简介:阿里巴巴云原生团队和阿里达摩院决策智能时序团队合作开发 AHPA 弹性预测产品,该产品主要出发点是基于检测到的周期做"定时规划",通过规划实现提前扩容的目的,在保证业务稳定 ...