CentOS系统故障 | 一桩"血案"引发的容器存储驱动比较

写在前面：

由于红帽在Linux界的影响力，相信很多朋友在测试和生产系统用的是RedHat或者CentOS系统，这次我在CentOS系统上遇到了一个很有意思的故障，通过这次故障的原因分析及解决，特意写了这篇文章分享给大家。

我们在CentOS上部署了一套Docker系统，运行了一段时间后，突然发现所有容器运行异常，同时宿主机内核报磁盘I/O错误：

看到问题的第一反映是查看磁盘状态和空间使用情况，发现系统的根目录已经用完：

我们知道，Docker默认的存储目录是在/var/lib/docker/下，同时我们也知道，可以通过使用-g, --graph=”/var/lib/docker” 参数修改Docker 默认存放路径。知道了问题后，我们可以通过挂载一个大硬盘到系统，并将Docker的目录更改为新挂载到硬盘上：

我将Docker的存储目录设置到刚才新增加的/data目录下，但是原来的镜像和容器都找不到了，因为路径改了。原来的镜像是在/var/lib/docker/devicemapper/devicemapper/{data，metadata}，转移文件后继续运行Docker服务，这样我们就有了一个300G的大房子给Docker们用了。

大家以为事情到了这里就完结了么？其实我也想，但是我顺便折腾了一下，于是又发生了接下来的事情。说我手贱也好，瞎折腾也罢，导入一堆容器镜像和运行一堆容器后，系统又光荣告诉我所有的容器根目录全部变成了只读，宿主机内核同样报磁盘I/O错误，一开始我以为data目录又被写满了，但是用df –Th命令查看后，发现目录还有很多空间：

但是残酷的现实是，只用了不到一半的空间后，所有的容器就全部出现异常了，这是我祭出了经典三板斧：重启容器，重启Docker服务，重启服务器。然并卵，容器还是运行异常。通过在网上爬了一堆资料，在http://jpetazzo.github.io/2014/01/29/docker-device-mapper-resize/上查到，CentOS默认用的是Device Mapper作为容器的存储驱动的，大家可以用dockers info命令查看，Docker服务启动时默认会在/var/lib/docker/devicemapper/devicemapper/目录创建一个100G（由于1000和1024换算的关系，系统实际显示的是107.4G，其他数字亦同）的data文件，然后启动的容器的所有变更的数据全部保存到这个data文件中；也就是说当容器内产生的相关data数据超过100G后容器就再也没有多余的空间可用，从而导致所有容器的根目录变为只读！同时它会限制每个容器最大为 10GB。太坑爹了有木有，给了大房子只能用100G！

为了找到根本原因，我们需要了解Device Mapper存储驱动的原理： Device Mapper存储驱动是以精简配置的方式运行的，它实际上是目标块设备的快照。

Docker启动时会设置一个100G的sparse文件（ /var/lib/docker/devicemapper/devicemapper/data，元数据为/var/lib/docker/devicemapper/devicemapper/metadata ），并将其作为Device Mapper的存储池，而所有容器都从该存储池中分配默认10G的存储空间使用，如下图所示：

当有实际读写后，这些存储块将在存储池中被标记为已使用（或者从池中拿走）。当实际读写的块容量大于池的容量时，容器的运行空间不足，所以报I/O错误。

Device Mapper存储驱动非常方便，你不需要做任何安装部署便可以使用：如创建额外的分区来存储 Docker 容器，或者建立LVM。然而它也有两个缺点：

• 存储池会有一个默认 100GB 的容量，满足不了大存储的需求。

• 它将会被稀疏文件所支持（精简配置，一开始基本不占用空间，只有当实际需要写的时候才会使用磁盘的存储块）但性能较差。

针对这些问题，有两个解决方案：

1. 使用更大的文件/磁盘/逻辑卷创建data文件：

2. 通过Docker启动参数的--storage-opt选项来限制每个容器初始化的磁盘大小，如-storage-opt dm.basesize=80G 这样每个容器启动后,根目录的总空间就是80G。

但是我总觉得这样的解决方式不够优雅，需要多步操作才能满足需求，同时，容器的空间还是被限制的，只是限制的大小变化而已。那有没有更好的办法呢? 让我们继续来爬资料，在Docker的官方网站上：

（https://docs.docker.com/engine/reference/commandline/dockerd/）

Docker在存储驱动方面支持 AUFS、Device Mapper、Btrfs、ZFS、 Overlay 、Overlay2等多址方式，现由于AUFS并未并入内核，目前只有Ubuntu系统上能够使用aufs作为docker的存储引擎，而在CentOS系统上默认使用Device Mapper,但是幸运的是，在Linux内核3.18.0以上的版本，是可以原生支持Overlay驱动方式的，Overlayfs跟AUFS很像，但是性能比AUFS好，有更好的内存利用。

Docker通过-s参数选择存储驱动，通过-s=overlay，我们将存储驱动器设置为Overlay方式，再重启Docker应用。

大家可以看到，现在Docker已经是使用了OverlayFS（这里大家要注意，如果系统有存储的镜像和运行的容器，更改存储驱动后将都不可用，请先行备份）。

通过修改为OverlayFS，Device Mapper的存储池容量限制及单个容器运行最大空间限制统统没有了，同时Overlay的读写性能也好于Device Mapper，只需通过-s=overlay一个参数即可优雅的使用更好的文件系统来运行容器。

至此，容器运行时I/O错误的原因已经完美解决，希望这篇文章能帮到在使用过程中遇到相同问题的朋友。

CentOS系统故障 | 一桩"血案"引发的容器存储驱动比较的更多相关文章

Centos 配置开机启动脚本启动 docker 容器
Centos 配置开机启动脚本启动 docker 容器 Intro 我们的 Centos 服务器上部署了好多个 docker 容器,因故重启的时候就会导致还得手动去手动重启这些 docker 容器,为 ...
CentOS7更改Docker默认镜像和容器存储位置
图片出处:https://bobcares.com/wp-content/uploads/docker-change-directory.jpg 一.Why? 通常,当你开始使用docker时,我们并 ...
CentOS 6.6下 BCM4312 802.11b/g无线网卡驱动安装
1.目前www.broadcom.com网站上最新版本为hybrid-v35,但此版本与2.6.32不匹配,无法识别验证密码,搜索网上说是要求升级内核,后根据http://www.dadclab.co ...
kubernetes/k8s CSI分析-容器存储接口分析
更多 k8s CSI 的分析,可以查看这篇博客kubernetes ceph-csi分析,以 ceph-csi 为例,做了详细的源码分析. 概述 kubernetes的设计初衷是支持可插拔架构,从而利 ...
docker容器存储
写在前面我们在上篇学习了容器网络,对容器网络驱动bridge工作原理做了较为详细的介绍,今天小作文一起看看容器中另一个关键域-存储. 容器的存储可以分为两大类: 一种是与镜像相关的即我们在<d ...
Longhorn 企业级云原生分布式容器存储-券(Volume)和节点(Node)
内容来源于官方 Longhorn 1.1.2 英文技术手册. 系列 Longhorn 是什么? Longhorn 云原生分布式块存储解决方案设计架构和概念 Longhorn 企业级云原生容器存储解决方 ...
context-param引发spring容器以及servlet容器的关联
转自:http://blog.csdn.net/liaoxiaohua1981/article/details/6759206 格式定义: [html] view plaincopy <cont ...
阿里云CentOS 6.5 设备、执行Docker容器和步骤的方法
ssh阿里云计算落地ssh username@ip uname -a 查看linux内核版本号,由于Docker推荐使用3.8内核以上,设版本号低可能会不稳定,因此须要选用yum方式升级内核. 导入 ...
由上一个血案引发的关于property和attribute关系的思考
boss说,学习要刨根问底. 好的,开刨. 一.property和attribute在英语里有什么区别看似没有区别.但其实大神说: property是物体本身自带属性,不能改变的(一旦改了就是另外 ...

随机推荐

appcan中evaluateScript、evaluatePopoverScript的使用
1. 如果要在某个主窗体中执行JS,使用 appcan.window.evaluateScript(name,scriptContent) eg: appcan.window.evaluateScri ...
10月17日 JS开始日~
1.变量提升变量提升是浏览器的一个功能,在运行js代码之前,浏览器会给js一个全局作用域,叫window, window分为两个模块,一个叫做内存模块,一个叫做运行模块,内存模块找到当前作用域下的 ...
搭建minima主题的github博客网站
layout: post title: "搭建minima主题的github博客网站" date: 2019-04-20 19:20:20 +0800 --- 作者:吴甜甜个人博 ...
CSU 1326：The contest（并查集+分组背包）
http://acm.csu.edu.cn/OnlineJudge/problem.php?id=1326 题意:…… 思路:并查集建图处理出边,然后分组背包. 之前不会分组背包,比赛的时候也推不出来 ...
asp.net core系列 67 Web压力测试工具WCAT
一.介绍最近搭建了一套CQRS框架,需要在投入开发前,进行必要的压力测试.Web Capacity Analysis Tool (Wcat)是一种轻量级HTTP负载生成工具,主要用于衡量受控环境中 ...
Modbus RTU新版本指令介绍
Modbus RTU新版本指令介绍 TIA V13 SP1版本软件中提供了2个版本的Modbus RTU指令: 图1. 两个版本Modbus RTU指令早期版本的Modbus RTU指令(图1. 中 ...
C# Linq 常用查询操作符
限定操作: 1. All:用来确定是否序列中的所有元素都满足条件 2. Any:用来确定序列是否包含任何元素,有参方式用来确定序列中是否有元素满足条件 3. Contains:方法用来确定序列是否包含 ...
剑指offer第二版-4.二维数组中的查找
面试题4:二维数组中的查找题目要求: 一个二维数组中,每一行从左到右递增,每一列从上到下递增.输入一个整数,判断数组中是否含有该整数 /** * @since 2019年2月13日下午5:08:5 ...
Spring Boot 邮件发送的 5 种姿势！
邮件发送其实是一个非常常见的需求,用户注册,找回密码等地方,都会用到,使用 JavaSE 代码发送邮件,步骤还是挺繁琐的,Spring Boot 中对于邮件发送,提供了相关的自动化配置类,使得邮件发送 ...
双剑合璧——掌握 cURL 和 Dig 走天涯
如今随着大量的应用转移到网络,作为开发者,会经常做一些通讯测试,例如从网站获取信息.模拟用户向网站提交或者上传数据,查看应用通讯情况等等,现在变成了非常重要的任务. 一起来认识 cURL cURL 是 ...

CentOS系统故障 | 一桩"血案"引发的容器存储驱动比较

CentOS系统故障 | 一桩"血案"引发的容器存储驱动比较的更多相关文章

随机推荐

热门专题