https://plpan.github.io/docker-exec-%E5%A4%B1%E8%B4%A5%E9%97%AE%E9%A2%98%E6%8E%92%E6%9F%A5%E4%B9%8B%E6%97%85/
锄禾日当午,值班好辛苦;
汗滴禾下土,一查一下午。
问题描述
今天,在值班排查线上问题的过程中,发现系统日志一直在刷docker异常日志:
1 2 3
|
May 12 09:08:40 HOSTNAME dockerd[4085]: time="2021-05-12T09:08:40.642410594+08:00" level=error msg="stream copy error: reading from a closed fifo" May 12 09:08:40 HOSTNAME dockerd[4085]: time="2021-05-12T09:08:40.642418571+08:00" level=error msg="stream copy error: reading from a closed fifo" May 12 09:08:40 HOSTNAME dockerd[4085]: time="2021-05-12T09:08:40.663754355+08:00" level=error msg="Error running exec 110deb1c1b2a2d2671d7368bd02bfc18a968e4712a3c771dedf0b362820e73cb in container: OCI runtime exec failed: exec failed: container_linux.go:348: starting container process caused \"read init-p: connection reset by peer\": unknown"
|
从系统风险性上来看,异常日志出现的原因需要排查清楚,并摸清是否会对业务产生影响。
下文简单介绍问题排查的流程,以及产生的原因。
问题排查
现在我们唯一掌握的信息,只有系统日志告知dockerd执行exec失败。
在具体的问题分析之前,我们再来回顾一下docker的工作原理与调用链路:

可见,docker的调用链路非常长,涉及组件也较多。因此,我们的排查路径主要分为如下两步:
定位组件
熟悉docker的用户能够一眼定位引起问题的组件。但是,我们还是按照常规的排查流程走一遍:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117
|
// 1. 定位问题容器 # sudo docker ps | grep -v pause | grep -v NAMES | awk '{print $1}' | xargs -ti sudo docker exec {} sleep 1 sudo docker exec aa1e331ec24f sleep 1 OCI runtime exec failed: exec failed: container_linux.go:348: starting container process caused "read init-p: connection reset by peer": unknown
// 2. 排除docker嫌疑 # docker-containerd-ctr -a /var/run/docker/containerd/docker-containerd.sock -n moby t exec --exec-id stupig1 aa1e331ec24f621ab3152ebe94f1e533734164af86c9df0f551eab2b1967ec4e sleep 1 ctr: OCI runtime exec failed: exec failed: container_linux.go:348: starting container process caused "read init-p: connection reset by peer": unknown
// 3. 排除containerd与containerd-shim嫌疑 # docker-runc --root /var/run/docker/runtime-runc/moby/ exec aa1e331ec24f621ab3152ebe94f1e533734164af86c9df0f551eab2b1967ec4e sleep runtime/cgo: pthread_create failed: Resource temporarily unavailable SIGABRT: abort PC=0x6b657e m=0 sigcode=18446744073709551610
goroutine 0 [idle]: runtime: unknown pc 0x6b657e stack: frame={sp:0x7ffd30f0d218, fp:0x0} stack=[0x7ffd2ab0e738,0x7ffd30f0d760) 00007ffd30f0d118: 0000000000000002 00007ffd30f7f184 00007ffd30f0d128: 000000000069c31c 00007ffd30f0d1a8 00007ffd30f0d138: 000000000045814e <runtime.callCgoMmap+62> 00007ffd30f0d140 00007ffd30f0d148: 00007ffd30f0d190 0000000000411a88 <runtime.persistentalloc1+456> 00007ffd30f0d158: 0000000000bf6dd0 0000000000000000 00007ffd30f0d168: 0000000000010000 0000000000000008 00007ffd30f0d178: 0000000000bf6dd8 0000000000bf7ca0 00007ffd30f0d188: 00007fdcbb4b7000 00007ffd30f0d1c8 00007ffd30f0d198: 0000000000451205 <runtime.persistentalloc.func1+69> 0000000000000000 00007ffd30f0d1a8: 0000000000000000 0000000000c1c080 00007ffd30f0d1b8: 00007fdcbb4b7000 00007ffd30f0d1e0 00007ffd30f0d1c8: 00007ffd30f0d210 00007ffd30f0d220 00007ffd30f0d1d8: 0000000000000000 00000000000000f1 00007ffd30f0d1e8: 0000000000000011 0000000000000000 00007ffd30f0d1f8: 000000000069c31c 0000000000c1c080 00007ffd30f0d208: 000000000045814e <runtime.callCgoMmap+62> 00007ffd30f0d210 00007ffd30f0d218: <00007ffd30f0d268 fffffffe7fffffff 00007ffd30f0d228: ffffffffffffffff ffffffffffffffff 00007ffd30f0d238: ffffffffffffffff ffffffffffffffff 00007ffd30f0d248: ffffffffffffffff ffffffffffffffff 00007ffd30f0d258: ffffffffffffffff ffffffffffffffff 00007ffd30f0d268: ffffffffffffffff ffffffffffffffff 00007ffd30f0d278: ffffffffffffffff ffffffffffffffff 00007ffd30f0d288: ffffffffffffffff ffffffffffffffff 00007ffd30f0d298: ffffffffffffffff 0000000000000000 00007ffd30f0d2a8: 00000000006b68ba 0000000000000020 00007ffd30f0d2b8: 0000000000000000 0000000000000000 00007ffd30f0d2c8: 0000000000000000 0000000000000000 00007ffd30f0d2d8: 0000000000000000 0000000000000000 00007ffd30f0d2e8: 0000000000000000 0000000000000000 00007ffd30f0d2f8: 0000000000000000 0000000000000000 00007ffd30f0d308: 0000000000000000 0000000000000000 runtime: unknown pc 0x6b657e stack: frame={sp:0x7ffd30f0d218, fp:0x0} stack=[0x7ffd2ab0e738,0x7ffd30f0d760) 00007ffd30f0d118: 0000000000000002 00007ffd30f7f184 00007ffd30f0d128: 000000000069c31c 00007ffd30f0d1a8 00007ffd30f0d138: 000000000045814e <runtime.callCgoMmap+62> 00007ffd30f0d140 00007ffd30f0d148: 00007ffd30f0d190 0000000000411a88 <runtime.persistentalloc1+456> 00007ffd30f0d158: 0000000000bf6dd0 0000000000000000 00007ffd30f0d168: 0000000000010000 0000000000000008 00007ffd30f0d178: 0000000000bf6dd8 0000000000bf7ca0 00007ffd30f0d188: 00007fdcbb4b7000 00007ffd30f0d1c8 00007ffd30f0d198: 0000000000451205 <runtime.persistentalloc.func1+69> 0000000000000000 00007ffd30f0d1a8: 0000000000000000 0000000000c1c080 00007ffd30f0d1b8: 00007fdcbb4b7000 00007ffd30f0d1e0 00007ffd30f0d1c8: 00007ffd30f0d210 00007ffd30f0d220 00007ffd30f0d1d8: 0000000000000000 00000000000000f1 00007ffd30f0d1e8: 0000000000000011 0000000000000000 00007ffd30f0d1f8: 000000000069c31c 0000000000c1c080 00007ffd30f0d208: 000000000045814e <runtime.callCgoMmap+62> 00007ffd30f0d210 00007ffd30f0d218: <00007ffd30f0d268 fffffffe7fffffff 00007ffd30f0d228: ffffffffffffffff ffffffffffffffff 00007ffd30f0d238: ffffffffffffffff ffffffffffffffff 00007ffd30f0d248: ffffffffffffffff ffffffffffffffff 00007ffd30f0d258: ffffffffffffffff ffffffffffffffff 00007ffd30f0d268: ffffffffffffffff ffffffffffffffff 00007ffd30f0d278: ffffffffffffffff ffffffffffffffff 00007ffd30f0d288: ffffffffffffffff ffffffffffffffff 00007ffd30f0d298: ffffffffffffffff 0000000000000000 00007ffd30f0d2a8: 00000000006b68ba 0000000000000020 00007ffd30f0d2b8: 0000000000000000 0000000000000000 00007ffd30f0d2c8: 0000000000000000 0000000000000000 00007ffd30f0d2d8: 0000000000000000 0000000000000000 00007ffd30f0d2e8: 0000000000000000 0000000000000000 00007ffd30f0d2f8: 0000000000000000 0000000000000000 00007ffd30f0d308: 0000000000000000 0000000000000000
goroutine 1 [running]: runtime.systemstack_switch() /usr/local/go/src/runtime/asm_amd64.s:363 fp=0xc4200fe788 sp=0xc4200fe780 pc=0x454120 runtime.main() /usr/local/go/src/runtime/proc.go:128 +0x63 fp=0xc4200fe7e0 sp=0xc4200fe788 pc=0x42bb83 runtime.goexit() /usr/local/go/src/runtime/asm_amd64.s:2361 +0x1 fp=0xc4200fe7e8 sp=0xc4200fe7e0 pc=0x456c91
rax 0x0 rbx 0xbe2978 rcx 0x6b657e rdx 0x0 rdi 0x2 rsi 0x7ffd30f0d1a0 rbp 0x8347ce rsp 0x7ffd30f0d218 r8 0x0 r9 0x6 r10 0x8 r11 0x246 r12 0x2bedc30 r13 0xf1 r14 0x11 r15 0x0 rip 0x6b657e rflags 0x246 cs 0x33 fs 0x0 gs 0x0 exec failed: container_linux.go:348: starting container process caused "read init-p: connection reset by peer"
|
由上可知,异常是runc返回的。
定位原因
定位异常组件的同时,runc还给了我们一个惊喜:提供了详细的异常日志。
异常日志表明:runc exec失败的原因是因为 Resource temporarily unavailable,比较典型的资源不足问题。而常见的资源不足类型主要包含(ulimit -a):
因此,我们需要进一步排查业务容器的监控,以定位不足的资源类型。

上图展示了业务容器的线程数监控。所有容器的线程数都已经达到1w,而弹性云默认限制容器的线程数上限就是1w,设定该上限的原因,也是为了避免单容器线程泄漏而耗尽宿主机的线程资源。
1 2
|
# cat /sys/fs/cgroup/pids/kubepods/burstable/pod64a6c0e7-830c-11eb-86d6-b8cef604db88/aa1e331ec24f621ab3152ebe94f1e533734164af86c9df0f551eab2b1967ec4e/pids.max 10000
|
至此,问题的原因已定位清楚,对,就是这么简单。
runc梳理
虽然,我们已经定位了异常日志的成因,但是,对于runc的具体工作机制,一直只有一个模糊的概念。
趁此机会,我们以runc exec为例,梳理runc的工作流程。
- runc exec首先启动子进程runc init
- runc init负责初始化容器namespace
- runc init利用C语言的constructor特性,实现在go代码启动之前,设置容器namespace
- C代码nsexec执行两次clone,共三个线程:父进程,子进程,孙进程,完成对容器namespace的初始化
- 父进程与子进程完成初始化任务后退出,此时,孙进程已经在容器namespace内,孙进程开始执行go代码初始化,并等待接收runc exec发送配置
- runc exec将孙进程添加到容器cgroup
- runc exec发送配置给孙进程,配置主要包含:exec的具体命令与参数等
- 孙进程调用system.Execv执行用户命令
注意:
- 步骤2.c与步骤3是并发执行的
- runc exec与runc init通信基于socket pair对(init-p和init-c)
runc exec过程中各进程的交互流程,以及namespace与cgroup的初始化参见下图:

综合我们对runc exec执行流程的梳理,以及runc exec返回的错误信息,我们基本定位到了runc exec返回错误的代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
|
func (p *setnsProcess) start() (err error) { defer p.parentPipe.Close() err = p.cmd.Start() p.childPipe.Close() if err != nil { return newSystemErrorWithCause(err, "starting setns process") } if p.bootstrapData != nil { if _, err := io.Copy(p.parentPipe, p.bootstrapData); err != nil { // clone标志位,ns配置 return newSystemErrorWithCause(err, "copying bootstrap data to pipe") } } if err = p.execSetns(); err != nil { return newSystemErrorWithCause(err, "executing setns process") } if len(p.cgroupPaths) > 0 { if err := cgroups.EnterPid(p.cgroupPaths, p.pid()); err != nil { // 这里将runc init添加到容器cgroup中 return newSystemErrorWithCausef(err, "adding pid %d to cgroups", p.pid()) } } if err := utils.WriteJSON(p.parentPipe, p.config); err != nil { // 发送配置:命令、环境变量等 return newSystemErrorWithCause(err, "writing config to pipe") }
ierr := parseSync(p.parentPipe, func(sync *syncT) error { // 这里返回 read init-p: connection reset by peer switch sync.Type { case procReady: // This shouldn't happen. panic("unexpected procReady in setns") case procHooks: // This shouldn't happen. panic("unexpected procHooks in setns") default: return newSystemError(fmt.Errorf("invalid JSON payload from child")) } }) if ierr != nil { p.wait() return ierr } return nil }
|
现在,问题的成因与代码分析已全部完成。
Reference
- https://www.kernel.org/doc/Documentation/cgroup-v1/pids.txt
- https://github.com/opencontainers/runc
- [转帖]Docker从入门到动手实践
Docker从入门到动手实践 https://www.cnblogs.com/nsky/p/10853194.html dockerfile的图很好呢. 但是自己没有做实验 , 其实知识都挺好. do ...
- docker启动失败如何查看容器日志
docker启动失败如何查看容器日志 在使用docker的时候,在某些未知的情况下可能启动了容器,但是过了没几秒容器自动退出了.这个时候如何排查问题呢? 通常碰到这种情况无非就是环境有问题或者应用有问 ...
- 使用docker exec 就可以进入container,例如:docker exec -it <container_id> /bin/bash
使用docker exec 就可以进入container,例如:docker exec -it <container_id> /bin/bash
- docker exec 运行命令
docker:/root/sbin# docker exec -it 17aaf60ee3a1 /sbin/ifconfig -a eth1 Link encap:Ethernet HWaddr 22 ...
- docker exec 系统找不到指定的路径。
相关问题和答案 >docker exec -it a1 echo "hello..." > /var/www/html/index.html 系统找不到指定的路径. & ...
- Docker exec 宿主对容器执行命令 - 五
Docker 下 exec 从宿主机对容器执行命名操作 docker exec -it # 交互可以进入容器 ; exec 也可以在宿主机对容器执行命令: docker attach # 也是可 ...
- centos7下docker启动失败解决
docker启动失败解决 could not change group /var/run/docker.sock to docker: gr... not found 如果出现:Job for doc ...
- docker exec进程是由谁产生的
1.问题: 通过docker exec产生的进程bash(5704)看ppid是docker-containe(5564),但是通过ptrace进程号5564没有关于clone的系统调用,就算ptra ...
- docker cp 和docker exec 查看docker 运行的容器信息
1. 使用docker 运行 redis 和 postgresql docker run -d -p : -v /redis/data/:/data redis docker run -d -p : ...
- docker attach 和 docker exec
docker attach docker attach -- Attach to a running container. 常用选项: --sig-proxy=true:Proxy all recei ...
随机推荐
- CentOS7 安装Python3.9以上版本时。编译报错,原因是openssl版本低
openssl-1.1.1安装 1.前因 python 导入clickhouse_driver需要import ssl和_ssl,报错 File"/home/oracle/python3/l ...
- elasticsearch oom问题分析
背景 线上发现elasticsearch集群状态red,并且有个es节点jvm内存使用不断升高,直到gc后依然内存不够使用,服务停止.查看日志,elasticsearch出现OOM报错. [2023- ...
- 【scikit-learn基础】--『监督学习』之 随机森林分类
随机森林分类算法是一种基于集成学习(ensemble learning)的机器学习算法,它的基本原理是通过对多个决策树的预测结果进行平均或投票,以产生最终的分类结果. 随机森林算法可用于回归和分类问题 ...
- flutter中去除导航栏与状态栏
方法一 SystemChrome.setEnabledSystemUIMode(SystemUiMode.manual, overlays: [SystemUiOverlay.bottom]); // ...
- 开发的必杀技:Git 的分支管理
摘要:作为一名码农,Git的使用就像家常便饭,时时刻刻都要用到,那么Git分支管理也是必须要掌握的. Git 分支管理 几乎每一种版本控制系统都以某种形式支持分支.使用分支意味着你可以从开发主线上分离 ...
- 当物联网遇上云原生:K8s向边缘计算渗透中
摘要:K8s正在向边缘计算渗透,它为边缘侧的应用部署提供了便利性,在一定程度上转变了边缘应用与硬件之间的关系,将两者的耦合度降低. 本文分享自华为云社区<云原生在物联网中的应用[拜托了,物联网! ...
- Hugging Face 入选 Time《时代周刊》2023 全球前 100 最具影响力的公司
喜报 Hugging Face 入选 Time<时代周刊>2023 全球前 100 最具影响力的公司 继续为梦想努力 继续为开源贡献 榜单链接: https://time.com/100c ...
- 文心一言 VS 讯飞星火 VS chatgpt (180)-- 算法导论13.4 3题
三.用go语言,在练习13.3-2 中,将关键字 41.38.31.12.19.8 连续插入一棵初始的空树中,从而得到一棵红黑树.请给出从该树中连续删除关键字 8.12.19.31.38.41 后的红 ...
- C++11实用特性2
1 可调用对象包装器.绑定器 1可调用对象 C++中的可调用对象分为四类: 函数指针: 任何一个函数都可以抽象成一个函数指针 int print(int a, double b) { cout < ...
- pip 的高阶玩法
pip 的高阶玩法 pip 应该是大家最熟悉的 Python 包安装与管理工具了,但是除了pip install 这个最常用的命令,还有很多有用的玩法.这里就介绍几个我平时会用到的,希望对大家有所帮助 ...