一、为什么需要容器探针

如何保持Pod健康

只要将pod调度到某个节点，Kubelet就会运行pod的容器，如果该pod的容器有一个或者所有的都终止运行(容器的主进程崩溃)，Kubelet将重启容器，所以即使应用程序本身没有做任何特殊的事，在Kubemetes中运行也能自动获得自我修复的能力。

自动重启容器以保证应用的正常运行，这是使用Kubernetes的优势，不过在某些情况，即使进程没有崩溃，有时应用程序运行也会出错。默认情况下Kubernetes只是检查Pod容器是否正常运行，但容器正常运行并不一定代表应用健康，在以下两种情况下Kubernetes将不会重启容器：

1.访问Web服务器时显示500内部错误

该报错可能是系统超载，也可能是资源死锁，不过此时httpd进程依旧运行，重启容器可能是最直接有效的办法。

2.具有内存泄漏的Java应用程序将开始抛出OutOfMemoryErrors

此时JVM进程会一直运行，Kubernetes也不会重启容器，但此时对应用来讲是异常的。

此时可以考虑从外部检查应用程序的运行状况：

Kubemetes可以通过存活探针(liveness probe)检查容器是否还在运行；

通过就绪探针(readiness probe)保证只有准备好了请求的Pod才能接收客户端请求。

二、LivenessProbe

1. 概念

Kubemetes可以通过存活探针(liveness probe)检查容器是否还在运行。可以为pod中的每个容器单独指定存活探针。如果探测失败，Kubemetes将定期执行探针并重新启动容器。

Kubernetes 支持三种方式来执行探针：

exec：在容器中执行一个命令，如果命令退出码返回0则表示探测成功，否则表示失败

tcpSocket：对指定的容IP及端口执行一个TCP检查，如果端口是开放的则表示探测成功，否则表示失败

httpGet：对指定的容器IP、端口及路径执行一个HTTP Get请求，如果返回的状态码在 [200,400)之间则表示探测成功，否则表示失败

2. exec探针

exec类型的探针通过在目标容器中执行由用户自定义的命令来判断容器的监控状态，若命令状态返回值为0则表示“成功”通过检测，其他值则均为“失败”状态。

2.1 创建liveness-exec.yaml

[root@master ~]# more liveness-exec.yaml

apiVersion: v1

kind: Pod

metadata:

  labels:

    test: liveness-exec

  name: liveness-exec

spec:

  restartPolicy: OnFailure

  containers:

  - name: liveness-exec

    image: busybox

    args:

    - /bin/sh

    - -c

    - touch /tmp/healthy; sleep 10; rm -rf /tmp/healthy; sleep 600

    livenessProbe:

      exec:

        command: ["test","-e","/tmp/healthy"]

      initialDelaySeconds: 5    #探测延时时长，第一次探测前等待5秒，默认为0

      periodSeconds: 5          #每5秒执行一次liveness探测,默认值10秒，最小1秒

      timeoutSeconds: 2         #超长时长，默认为1s,最小值也为1s

      failureThreshold: 3       #处于成功状态时，探测操作至少连续多少次的失败才被视为检测不通过，默认为3，最小为1

[root@master ~]# kubectl apply -f liveness-exec.yaml

pod/liveness-exec created

2.2 查看Pod

[root@master ~]# kubectl get po -o wide

[root@master ~]# kubectl describe po liveness-exec

pod运行正常，10秒内文件/tmp/healthy还存在，probe检测正常。

第15秒，probe再次检测，由于文件被删，检测失败，此后容器会进行多次重启操作。

3. HTTP探针

基于HTTP的探测(HTTPGetAction)向目标容器发起一个HTTP请求，根据其相应码进行结果判定，响应码如2xx或3xx时表示检测通过。

3.1 创建liveness-http.yaml

[root@master ~]# more liveness-http.yaml

apiVersion : v1

kind: Pod

metadata:

  labels:

    test: liveness

  name: liveness-http

spec:

  containers:

  - name: liveness-http

    image: nginx

    ports:

    - name: http

      containerPort: 80

    lifecycle:

      postStart:

        exec:

          command: ["/bin/sh" ,"-c","echo liveness-http test > /usr/share/nginx/html/health"]

    livenessProbe:

      httpGet:

        path: /health

        port: http

        scheme: HTTP

[root@master ~]# kubectl apply -f liveness-http.yaml

pod/liveness-http created

3.2 查看Pod

[root@master ~]# kubectl get po -o wide

NAME            READY   STATUS    RESTARTS   AGE   IP             NODE     NOMINATED NODE   READINESS GATES

liveness-http   1/1     Running   0          5s    10.244.2.206   node02   <none>           <none>

[root@master ~]# curl 10.244.2.206/health

liveness-http test

3.3 删除测试页面health

[root@master ~]# kubectl exec -it liveness-http rm /usr/share/nginx/html/health

探测失败，返回码404，重启容器。

4. TCP探针

基于TCP的存活性探测(TCPSocketAction)用于向容器的特定端口发起TCP请求并尝试建立连接，连接成功即为通过检测。

4.1 创建liveness-tcp.yaml

[root@master ~]# more liveness-tcp.yaml

apiVersion: v1

kind: Pod

metadata:

  labels:

    test: liveness

  name: liveness-tcp

spec:

  containers:

  - name: liveness-tcp

    image: nginx

    ports:

    - name: http

      containerPort: 80

    livenessProbe:

      tcpSocket:

        port: http

[root@master ~]# kubectl apply -f liveness-tcp.yaml

pod/liveness-tcp created

[root@master ~]# kubectl get po -o wide

NAME           READY   STATUS    RESTARTS   AGE   IP             NODE     NOMINATED NODE   READINESS GATES

liveness-tcp   1/1     Running   0          4s    10.244.2.217   node02   <none>           <none>

[root@master ~]# curl 10.244.2.217:80

4.2 修改默认端口

[root@master ~]# kubectl exec -it liveness-tcp -- sed -i 's/^ *listen 80/ listen 81/g' /etc/nginx/conf.d/default.conf

如果kubectl exec在容器内执行命令时如果带参数则需加上’–’

加载nginx

[root@master ~]# kubectl exec -it liveness-tcp -- nginx -s reload

4.3 查看Pod

[root@master ~]# kubectl describe po liveness-tcp

80是nginx的默认端口，开始发起TCP连接的端口也是80，默认端口改成81后连接报错，容器重启。

三、ReadinessProbe

1. 概念

用于容器的自定义准备状态检查。如果ReadinessProbe检查失败，Kubernetes会将该Pod从服务代理的分发后端去除，不再分发请求给该Pod。

2. readinessprobe使用场景

Pod对象启动后，容器应用通常需要一段时间才能完成其初始化过程，例如加载配置或数据，甚至有些程序需要运行某类的预热过程，若在此阶段完成之前接入客户端的请求，势必会因为等待太久而影响用户体验，这时就需要就绪探针。

如果没有将就绪探针添加到pod中，它们几乎会立即成为服务端点。如果应用程序需要很长时间才能开始监听传入连接，则在服务启动但尚未准备好接收传入连接时，客户端请求将被转发到该pod。因此，客户端会看到"连接被拒绝"类型的错误。

3. 机制

与存活探针机制相同，就绪探针也支持Exec、HTTP GET和TCP Socket三种探测方式，且各自的定义机制相同，将容器定义中的livenessProbe字段名替换为readinessProbe即可定义出就绪探测的配置，这里不再赘述。

4. 创建readiness-exec.yaml

本文以exec方式为例实践

[root@master ~]# more liveness-exec.yaml

apiVersion: v1

kind: Pod

metadata:

  labels:

    test: liveness-exec

  name: liveness-exec

spec:

  restartPolicy: OnFailure

  containers:

  - name: liveness-exec

    image: busybox

    args:

    - /bin/sh

    - -c

    - touch /tmp/healthy; sleep 10; rm -rf /tmp/healthy; sleep 600

    livenessProbe:

      exec:

        command: ["test","-e","/tmp/healthy"]

      initialDelaySeconds: 5    #探测延时时长，第一次探测前等待5秒，默认为0

      periodSeconds: 5          #每5秒执行一次liveness探测,默认值10秒，最小1秒

      timeoutSeconds: 2         #超长时长，默认为1s,最小值也为1s

      failureThreshold: 3       #处于成功状态时，探测操作至少连续多少次的失败才被视为检测不通过，默认为3，最小为1

[root@master ~]# kubectl apply -f readiness-exec.yaml

pod/readiness-exec created

5. 查看Pod

[root@master ~]# kubectl get po readiness-exec -w

NAME             READY   STATUS              RESTARTS   AGE

readiness-exec   0/1     ContainerCreating   0          2s

readiness-exec   0/1     Running             0          3s

readiness-exec   1/1     Running             0          9s

readiness-exec   0/1     Running             0          24s

'-w’选项可以监视pod资源变动，刚开始尽管pod处于Running状态，但知道就绪探测命令执行成功后pod资源才ready

刚开始处于’预热’阶段，pod为running状态但不可用；当10秒后（initialDelaySeconds + periodSeconds），readinessprobe开始第一次探测，成功后pod处于ready状态，45秒后（sleep30 + periodSeconds * failureThreshold）探测失败，pod再次为running但not ready状态。

6. 与livenessprobe区别

如果容器中的进程能够在遇到问题或不健康的情况下自行修复，则不一定需要存活探针; kubelet 将根据Pod的restartPolicy自动执行正确的操作。
如果您希望容器在探测失败时被杀死并重新启动，那么请指定一个存活探针，并指定restartPolicy为Always或OnFailure。
如果要仅在探测成功时才开始向 Pod 发送流量，请指定就绪探针。在这种情况下，就绪探针可能与存活探针相同，但是spec中的就绪探针的存在意味着Pod将在没有接收到任何流量的情况下启动，并且只有在探针探测成功后才开始接收流量。
两种探测的配置方法完全一样，支持的配置参数也一样，既可单独探测又可结合者一起执行。

k8s livenessprobe和readinessprobe详解的更多相关文章

Kubernetes K8S之存储ConfigMap详解
K8S之存储ConfigMap概述与说明,并详解常用ConfigMap示例主机配置规划服务器名称(hostname) 系统版本配置内网IP 外网IP(模拟) k8s-master CentOS ...
Kubernetes K8S之存储Volume详解
K8S之存储Volume概述与说明,并详解常用Volume示例主机配置规划服务器名称(hostname) 系统版本配置内网IP 外网IP(模拟) k8s-master CentOS7.7 2C ...
k8s之yaml文件详解
k8s之yaml文件详解目录 k8s之yaml文件详解 1. k8s支持的文件格式 2. YAML语言格式 3. 查看api资源版本标签 4. 编写nginx-test.yaml资源配置清单 4.1 ...
Kubernetes学习之路（二十）之K8S组件运行原理详解总结
目录一.看图说K8S 二.K8S的概念和术语三.K8S集群组件 1.Master组件 2.Node组件 3.核心附件四.K8S的网络模型五.Kubernetes的核心对象详解 1.Pod资源对 ...
Kubernetes K8S之Service服务详解与示例
K8S之Service概述与代理说明,并详解所有的service服务类型与示例主机配置规划服务器名称(hostname) 系统版本配置内网IP 外网IP(模拟) k8s-master Cent ...
Kubernetes K8S之存储Secret详解
K8S之存储Secret概述与类型说明,并详解常用Secret示例主机配置规划服务器名称(hostname) 系统版本配置内网IP 外网IP(模拟) k8s-master CentOS7.7 ...
k8s架构与组件详解
没有那么多花里胡哨,直接进行一个K8s架构与组件的学习. 一.K8s架构 k8s系统在设计是遵循c-s架构的,也就是我们图中apiserver与其余组件的交互.在生产中通常会有多个Master以实现K ...
【K8S】Service服务详解，看这一篇就够了！！
k8s用命名空间namespace把资源进行隔离,默认情况下,相同的命名空间里的服务可以相互通讯,反之进行隔离. 1.1 Service Kubernetes中一个应用服务会有一个或多个实例(Pod, ...
k8s配置集ConfigMap详解
ConfigMap介绍 ConfigMap和Secret是Kubernetes系统上两种特殊类型的存储卷,ConfigMap对象用于为容器中的应用提供配置文件等信息.但是比较敏感的数据,例如密钥.证书 ...
K8S发布应用步骤详解
前言首先以SpringBoot应用为例介绍一下k8s的发布步骤. 1.从代码仓库下载代码,比如GitLab: 2.接着是进行打包,比如使用Maven: 3.编写Dockerfile文件,把步骤2产生 ...

随机推荐

七、Doris Colocation Join
Colocation Join 是在 Doris 0.9 版本中引入的新功能.旨在为某些 Join 查询提供本地性优化,来减少数据在节点间的传输耗时,加速查询. 1.基本理论 Join 的常见连接类型 ...
Git——分支管理（2）
Git--分支管理(2) 提示:图床在国外且动图比较多的情况下,需要时间加载. 目录: 目录 Git--分支管理(2) 提示:图床在国外且动图比较多的情况下,需要时间加载. 目录: Git基础 Git ...
Flutter 多线程实现
异步Isolate实现多线程最近在看Flutter开发相关知识点,对照着Android原生,探究了下多线程实现方式.在Flutter中有 Isolate,隔离,它的实现原理并不是内存共享的,它更 ...
salesforce零基础学习（一百三十六）零碎知识点小总结（八）
本篇参考: Salesforce LWC学习(七) Navigation & Toast https://developer.salesforce.com/docs/platform/lwc/ ...
推荐一个好用的.net开发框架
企业应用开发平台(Enterprise Develop Platform),以下简称EDP.EDP是一套集完整组织架构,全面权限体系,以及各类基础功能于一体的基于.net的企业应用开发平台.其最大的特 ...
inno Setup 打包Java exe可执行文件和MySQL数据库，无需额外配置实现一键傻瓜式安装
前言出现有需要打包 Java 应用和 Mysql数据库成一个安装包给出去的需求,这里我把整个打包的流程整理一下. 环境 JDK17; MySQL 5.7; 流程 Jpackage打包EXE Jpac ...
C数据结构：循环队列的顺序存储结构
顺序队列目录队列的定义定义假溢出空间浪费的缺点如何解决循环队列的缺点 *==主要的算法思想(重要)==* 如何理解循环队列(必看) 结构体代码两种实现方法 **①循环队列,队头和队尾指针 ...
4G EPS 的网络协议栈
目录文章目录目录前文列表 LTE/EPC 协议栈 E-UTRAN 空中接口协议栈用户平面协议 PHY 层 MAC 层 RLC 层 PDCP 层控制平面协议 RRC 层 NAS 层 EPC 核 ...
openstack以后需要研究一下的知识
1. openvt是一个用于在虚拟终端上启动程序的命令行工具.它允许用户在一个新的虚拟终端(VT)上启动一个程序,并将标准输入.输出和错误输出定向到该终端. openvt的用法如下: 打开一个虚拟终端 ...
Java面试题：SpringBoot异常捕获，让程序“免疫”一切错误！
在Spring Boot应用程序中,捕获全局异常是一个重要的方面,它可以帮助我们处理在应用程序运行时可能发生的各种错误情况.通过适当地捕获和处理这些异常,我们可以改善用户体验并及时采取必要的措施. 使 ...

k8s livenessprobe和readinessprobe详解

一、为什么需要容器探针

如何保持Pod健康

二、LivenessProbe

1. 概念

2. exec探针

2.1 创建liveness-exec.yaml

2.2 查看Pod

3. HTTP探针

3.1 创建liveness-http.yaml

3.2 查看Pod

3.3 删除测试页面health

4. TCP探针

4.1 创建liveness-tcp.yaml

4.2 修改默认端口

4.3 查看Pod

三、ReadinessProbe

1. 概念

2. readinessprobe使用场景

3. 机制

4. 创建readiness-exec.yaml

5. 查看Pod

6. 与livenessprobe区别

k8s livenessprobe和readinessprobe详解的更多相关文章

随机推荐

热门专题