k8s错误集合
1、etcd没有启动的
[root@mcwk8s03 ~]# kubectl get nodes
Unable to connect to the server: context deadline exceeded
启动之后就可以使用了
[root@mcwk8s03 ~]# kubectl get nodes
NAME STATUS ROLES AGE VERSION
mcwk8s05 NotReady <none> 404d v1.15.12
mcwk8s06 NotReady <none> 404d v1.15.12
[root@mcwk8s03 ~]#
2、pod一直重启。首先排查oom,上次重启原因
Containers:
fab-browser-api:
Container ID: docker://9xx
Image: roc.xx79
Image ID: docxxd
Port: 9090/TCP
Host Port: 0/TCP
Command:
java
-Xms1G
-Xmx2G
-XX:MetaspaceSize=64M
-XX:MaxMetaspaceSize=128M
-Xss256K
-XX:+UseConcMarkSweepGC
-XX:CMSFullGCsBeforeCompaction=5
-XX:+UseCMSCompactAtFullCollection
-XX:CMSInitiatingOccupancyFraction=80
-XX:+HeapDumpOnOutOfMemoryError
-XX:HeapDumpPath=./logs/
-DserverName=fxx-api
-jar
/app.jar
State: Running
Started: Mon, 18 Dec 2023 10:12:11 +0800
Last State: Terminated
Reason: OOMKilled
Exit Code: 137
Started: Mon, 18 Dec 2023 04:09:38 +0800
Finished: Mon, 18 Dec 2023 10:12:09 +0800
Ready: True
Restart Count: 36
Limits:
cpu: 1
memory: 2000Mi
Requests:
cpu: 300m
memory: 800Mi
Liveness: http-get http://:9090/argus/health delay=120s timeout=1s period=20s #success=1 #failure=6
Readiness: http-get http://:9090/argus/health delay=120s timeout=1s period=20s #success=1 #failure=6
3、k8s排查问题思路
https://zhuanlan.zhihu.com/p/421693641
https://zhuanlan.zhihu.com/p/651299187
https://blog.csdn.net/weixin_45727359/article/details/128024686
4、有些服务启动慢,默认的健康检查时间需要调整长一些,等服务启动之后再健康检查
现象:发布应用,新起的pod,一直没有启动起来,反复重启。
kubectl describe pod ,查看上次报错,并且事件里提示健康检查没有通过
State: Running
Started: Tue, 09 Jan 2024 10:32:56 +0800
Last State: Terminated
Reason: Error
Exit Code: 143
Started: Tue, 09 Jan 2024 10:29:03 +0800
Finished: Tue, 09 Jan 2024 10:32:55 +0800
Ready: True
Restart Count: 1
Warning Unhealthy 6m30s (x22 over 10m) kubelet, qa-kube003.xx.x.com Readiness probe failed:
Get http://10.96.x.x:9090/argus/health: dial tcp 10.x.x.x:9090: connect: connection refused
解决方法:容器的健康检查失败,容器多次重启,偶尔才起来。这次这个是服务启动需要3分钟多,而健康检查200s的时候就开始了。服务还没正常启动起来就检测,导致探测失败。将探测时间延长到250s之后,再次发布,就没有发生重启的现象了,直接就好了
kubectl edit deploy ai-xxl-deploy
复制配置,然后在服务发布里面添加上配置,并且将时间改为250s,发布应用

k8s错误集合的更多相关文章
- springboot整合mybatis步骤以及错误集合
1.首先在springboot项目中的pomx文件引入官方的依赖 <groupId>org.mybatis.spring.boot</groupId> <artifact ...
- AndroidStudio NDK配置使用以及错误集合
Error:Execution failed for task ':app:transformNative_libsWithStripDebugSymbolForDebug'. > java.l ...
- jq ajax遇到的错误集合
一.错误: Uncaught InvalidStateError: Failed to read the 'selectionDirection' property from 'HTMLInputEl ...
- ssh框架搭建错误集合
1,把jsp放入到WEB-INF/view目录下,struts2.xml配置<result name="success">/WEB-INF/view/home.jsp& ...
- VS(C++)编程遇到的错误集合
编译错误 1.error C1010: 原因:没有在文件开头添加include "stdafx.h". 2.error C2440: "=": 无法从" ...
- SQL访问EXCEL错误集合
--行集函数 --1, OPENDATASOURCE 环境:WIN7,SQL 2014,OFFICE 2013 SELECT * FROM OPENDATASOURCE('Microsoft.ACE. ...
- Hibernate学习笔记--Hibernate框架错误集合及解决
错误1:MappingException: Unknown entity解决方案 http://jingyan.baidu.com/article/e75aca8552761b142edac6cf.h ...
- IOS 错误集合以及解决办法(持续整理中)
1 . 如下错误: app:resource fork, Finder information, or similar detritus not al site:forums.developer.ap ...
- Spring《错误集合,总结更新》
1.这几天配置springmvc 使用注解,并且自动扫描注解,当我单个配置,不用自动扫描,出现下面错误,找了很多人跟我看,配置也没问题,但是就是显示不出东西,所说的类也去看了,没有问题 這是我的模拟数 ...
- 【Android应用开发】Android Studio 错误集锦 -- 将所有的 AS 错误集合到本文
. 一. 编译错误 1. "AndroidManifest.xml file not found" 错误 (1) 报错信息 报错信息 : -- Message Make : Inf ...
随机推荐
- Manacher小记
目录 前言 洛谷 3805[模板]manacher算法 题目 分析 代码 洛谷 4555 最长双回文串 题目 分析 代码 洛谷 1659 拉拉队排练 题目 分析 代码 前言 皆移植于原csdn博客,略 ...
- protocol buffer没那么难,不信你看这篇
目录 简介 定义一个消息 类型定义 字段的值 字段描述符 添加注释 嵌套类型 Map 总结 简介 上一篇文章我们对google的protobuf已经有了一个基本的认识,并且能够使用相应的工具生成对应的 ...
- 【直播回顾】OpenHarmony知识赋能五期第六课——子系统相机解读
5月26日晚上19点,知识赋能第五期第六节课 <OpenHarmony标准系统多媒体子系统之相机解读> ,在OpenHarmony开发者成长计划社群内成功举行. 本期课程,由深开鸿资 ...
- WPF 像CSS一样使用 Font Awesome 图标字体
WPF 像CSS一样使用 Font Awesome 图标字体 编写目的 WPF中使用这种图标字体不免会出现可读性差的问题,现阶段网络上有的大部分实现方式都是建立枚举,我感觉这样后续维护起来有些麻烦,需 ...
- 实训篇-Css-跳动的红心
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...
- ORA-01555:snapshot too old: rollback segment number X with name "XXXX" too small
ORA-01555:snapshot too old: rollback segment number X with name "XXXX" too small 在查询快照的时候 ...
- 力扣35(java&python)-搜索插入位置(简单)
题目: 给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引.如果目标值不存在于数组中,返回它将会被按顺序插入的位置. 请必须使用时间复杂度为 O(log n) 的算法. 示例 1: 输入: ...
- 力扣539(java)-最小时间差(中等)
题目: 给定一个 24 小时制(小时:分钟 "HH:MM")的时间列表,找出列表中任意两个时间的最小时间差并以分钟数表示. 示例 1: 输入:timePoints = [" ...
- 力扣172(java)-阶乘后的零(中等)
题目: 给定一个整数 n ,返回 n! 结果中尾随零的数量. 提示 n! = n * (n - 1) * (n - 2) * ... * 3 * 2 * 1 示例 1: 输入:n = 3输出:0解释: ...
- 一文剖析PolarDB HTAP的列存数据压缩
简介: PolarDB MySQL是阿里云自研的云原生数据库,主要处理在线事务负载(OLTP, OnLine Transactional Processing),深受企业用户的青睐. 前言 数据库迁移 ...