由Docker垃圾回收机制引发的一场血案

AlstonWilliams 关注

2017.04.01 19:00* 字数 1398 阅读 253评论 0喜欢 0

今天早晨,在我还没睡醒的时候,我们团队中的一名成员就告诉我,我写的微服务中,上传头像的那个没法用.而我在发布之前,已经测试过可以使用了.那这到底是怎么回事呢?

首先,我重新执行了一遍测试过程,发现生产服务器上的微服务上的这个上传头像的接口确实不可用.

然后,我在本地启动了一下微服务,同样测试了一下微服务.发现还是不可用.同时,通过本地打印错误日志,发现错误是在执行保存图片这个写操作的时候:Error: socket hang up.

开始以为是网络故障,但是访问网页以及通过SSH登陆到那台服务器都没有问题.

既然不是网络故障的原因.那到底是什么导致的呢?

通过查看Couchdb容器的日志,我发现了有如下错误日志:

你能从中看出是什么原因吗?错误就隐藏在这中间.

同样,我也是第一次使用CouchDB这个数据库,这个错误栈让我也很懵逼.这是啥意思?

这个看不懂,只好根据Error: socket hang up这个错误来猜了.猜测是打开数据库的连接太多.

顺着这个主线,通过查看CouchDB官方文档,我们发现默认的最大连接数就是1024,有图有真相:

通过curl -X GET http://server_ip:5984/_stats | json_reformat这条命令,我发现,当前数据库的总共HTTP请求才有49个:

也不是达到了最大连接数,导致不能创建新的连接的原因.那是因为什么呢?

还记得上面的错误信息吗?其中有一条是enospc.那这个到底是什么意思呢?No space.没有空间.

这就很容易解释为什么写操作会报错,而读操作却正常运行的原因了.

那为什么会没有空间呢?有两个原因,一是磁盘没有空间了,二是没有Inode可用了.

CouchDB本身是在一个容器中运行,它使用的是主机的资源.所以,很有可能是主机没有空间了.

一个容器中的所有的东西,都是存放在/var/lib/docker文件夹下的相应的文件系统中的.我这里因为是ubuntu系统,所以是存放在/var/lib/docker/aufs/mnt这个目录中.

而这个目录又是挂载到主机的/目录下.

所以,只要/var/lib/docker/aufs/mnt这个目录中存满了东西,主机上的/也就没有空间了.你在主机上进行任何写操作都不会成功.

运行df -h命令,发现果然是/目录中没有空间了.已用100%.

那我们如何来清理/var/lib/docker/aufs/mnt或者/这两个目录,让它们腾出来空间呢?

首先,我想到的是清理掉系统中的不必要的包,使用下面的命令:sudo apt-get autocleansudo apt-get autoremove

然而,并没有什么作用.还是100%.

然后,通过docker ps -a命令,我发现存在着几个已经退出或者被创建但是没有运行的容器.它们占用了一些宝贵的空间.

然后,通过docker rm -f &(docker ps -qf status=exited)和docker rm -f &(docker ps -qf status=created)命令移除那些没用的容器.结果,发现还是不管用.

其实,通过这种方式虽然移除了容器,但是和它们相关的卷并没有移除,我又通过docker volume ls -qf dangling=true | xargs -r docker volume rm命令,移除了那些没用的卷.

上面的删除容器和其相关的卷的命令,我们可以简化为:docker rm -v -f &(docker ps -qf status=exited)

这时候,再通过df -h命令,我们就能看到已用到了82%了:

因为我这里没有没用的镜像,所以就没有进行移除镜像的操作.

我们为什么命题为”由Docker垃圾回收机制引发的一场血案”呢?因为我一直都以为如果容器被移除掉,其对应的卷也会自动被回收.然而事实证明并没有.

从上图中你也可以看到,我们的这台服务器总容量才20G.实际上,我们不应当使用硬盘容量这么小的服务器来运行Docker容器.

清除了一定的空间,再测试上传头像接口,就可以正常使用了.

出了这次事故,我专门去官网看了看Docker的垃圾回收机制,发现目前官网只提供了针对Docker Registry的垃圾回收机制.而且还是需要手动运行bin/registry garbage-collect [–dry-run] /path/to/config.yml这条命令.

实际上,我们也完全可以自己写一个简单的脚本来进行垃圾回收.Github上也提供了相应的工具,有docker-cleanup-volumes以及其他的卷管理工具.这些我也没试过,请自行查看.

Docker垃圾回收机制的更多相关文章

  1. docker 垃圾回收机制

    docker垃圾回收机制 作者: 张首富 时间: 2019-04-10 个人博客: www.zhangshoufu.com QQ群: 895291458 说明 对于Docker来说,存在镜像/容器/存 ...

  2. .net垃圾回收机制编程调试试验

    1. 什么是CLR GC? 它是一个基于引用跟踪和代的垃圾回收器. 从本质上,它为系统中所有活跃对象都实现了一种引用跟踪模式,如果一个对象没有任何引用指向它,那么这个对象就被认为是垃圾对象,并且可以被 ...

  3. JavaScript具有自动垃圾回收机制

    JavaScript具有自动垃圾回收机制 原理: 找出那些不再继续使用的变量,然后释放其占用的内存.   正常的生命周期:     局部变量指在函数执行的过程中存在.而在这个过程中,会为局部变量在栈或 ...

  4. java垃圾回收机制

    1 .垃圾回收机制(GC)垃圾回收就是回收内存中不再使用对象:(1)垃圾回收的步骤:1)查找内存中不再使用的对象:2)释放这些对象所占用的内存:(2)查找内存中不再使用的对象方法:1)引用计数法如果一 ...

  5. 垃圾回收机制GC知识再总结兼谈如何用好GC

    一.为什么需要GC 应用程序对资源操作,通常简单分为以下几个步骤: 1.为对应的资源分配内存 2.初始化内存 3.使用资源 4.清理资源 5.释放内存 应用程序对资源(内存使用)管理的方式,常见的一般 ...

  6. 【转载】Java垃圾回收机制

    原文地址:http://www.importnew.com/19085.html Java垃圾回收机制 说到垃圾回收(Garbage Collection,GC),很多人就会自然而然地把它和Java联 ...

  7. 【转】深入理解 Java 垃圾回收机制

    深入理解 Java 垃圾回收机制   一.垃圾回收机制的意义 Java语言中一个显著的特点就是引入了垃圾回收机制,使c++程序员最头疼的内存管理的问题迎刃而解,它使得Java程序员在编写程序的时候不再 ...

  8. JAVA的垃圾回收机制

    1. 垃圾回收的意义 在C++中,对象所占的内存在程序结束运行之前一直被占用,在明确释放之前不能分配给其它对象:而在Java中,当没有对象引用指向原先分配给某个对象的内存时,该内存便成为垃圾.JVM的 ...

  9. Python的垃圾回收机制

    Python的GC模块主要运用了“引用计数”(reference counting)来跟踪和回收垃圾.在引用计数的基础上,还可以通过“标记-清除”(mark and sweep)解决容器对象可能产生的 ...

随机推荐

  1. Ethernet、VLAN、QinQ

    以太网帧格式: 各字段解释: DMAC:目的MAC地址,该字段确定帧的接收者. SMAC:源MAC地址,该字段标识发送帧的工作站. Type:上层协议类型(0x0800:IP;0x0808:ARP;0 ...

  2. iPhone开发资源汇总

    如何用Facebook graphic api上传视频: http://developers.facebook.com/blog/post/532/ Keychain保存数据封装: https://g ...

  3. confd与etcd的使用

    Add keys This guide assumes you have a working etcd, or consul server up and running and the ability ...

  4. Mysql查询架构信息

    今天想给整个数据库做初始化,也就是清空所有表,然后让索引归零,使用truncate table 就可以,但好多张表,怎么批量搞定呢? 有人说重建表吧,dump一下,然后再重建,但我还是想用trunca ...

  5. HihoCoder 1075 开锁魔法III(概率DP+组合)

    描述 一日,崔克茜来到小马镇表演魔法. 其中有一个节目是开锁咒:舞台上有 n 个盒子,每个盒子中有一把钥匙,对于每个盒子而言有且仅有一把钥匙能打开它.初始时,崔克茜将会随机地选择 k 个盒子用魔法将它 ...

  6. 每天一个linux命令(磁盘):【转载】du 命令

    Linux du命令也是查看使用空间的,但是与df命令不同的是Linux du命令是对文件和目录磁盘使用的空间的查看,还是和df命令有一些区别的. 1.命令格式: du [选项][文件] 2.命令功能 ...

  7. bzoj 5334 数学计算

    bzoj 5334 数学计算 开始想直接模拟过程做,但模数 \(M\) 不一定为质数,若没有逆元就 \(fAKe\) 掉了. 注意到操作 \(2\) 是删除对应的操作 \(1\) ,相当于只有 \(1 ...

  8. 推荐近乎免费的调试神器——OzCode

    当一只断点打在 Visual Studio 的代码编辑器中,程序命中断点的那一刻,调试才刚刚开始……这个时候忙碌的手在键盘和鼠标之间来回跳跃,试图抓住每一次单步执行带来的状态改变. 如果命中断点的那一 ...

  9. Tornador之初识(一)

    一.最简单的web服务器 import socket def handle_request(client): buf = client.recv(1024) client.send("HTT ...

  10. ldo的一些参数理解

    psrr是衡量ldo抑制外来信号噪声的能力,而内部噪声是由基准电压和误差放大器引入的.通常器件手册说的输出噪声指的就是内部噪声. ldo的暂态响应也是一个重要指标