Docker常见故障
— Docker虚拟化故障 —
Docker虚拟化主要有三类故障:
应用故障:应用执行状态与预期不一致。
容器故障:无法正确创建、停止、更新容器等。
集群故障:集群创建失败、更新失败、无法连接等。
— Docker虚拟化故障排错 —
所有的Docker虚拟化故障排查诊断,都可以通过Docker命令行工具或者Web控制台来完成。
通过WEB控制台查看,需要自建控制台,对于Docker运维管理员来说,命令行工具排错是一个不错的帮手。
— 故障排错案例1 —
案例描述:
生产环境,全新安装的Docker无法启动,报错信息如下:
systemctl start docker.service
Job for docker.service failed because
the control process exited with error code.See
"systemctl status docker.service" and "journalctl -xe" for details
通过journalctl -xe命令查看启动的详细日志,启动daemon错误,因为Selinux不支持,Selinux阻挡了Docker引擎的启动.
解决方案:
如上问题,解决方法有两种:
1.Selinux主配置文件:
/etc/selinux/config,将配置文件中enforcing设置为disabled,然后重启系统,然后重启docker引擎即可。
2.docker主配置文件:
/etc/sysconfig/docker,将配置文件中--selinux-enabled选项为false,改成:--selinux-enabled=false即可。
— 故障排错案例2 —
案例描述:
Docker虚拟化引擎报错信息如下:
chown socket at step GROUP: No such process
解决方案:
如上错误提示是因为Docker无法找到Group组信息,docker组有可能被误删除,解决方法有两种:
1.创建宿主机docker组即可,命令:groupadd docker;
2./usr/lib/systemd/system/docker.socket文件,SocketGroup=修改为root也可以;
— 故障排错案例3 —
案例描述:
Docker虚拟化引擎报错信息如下:
如上错误提示是因为Linux操作系统没有更多的Loopback 设备给Docker使用。
解决方案:
创建更多的Loopback设备即可,命令如下:
for i inseq 0 6;do mknod -m 0660 /dev/loop$i b 7 $i;done
— 故障排错案例4 —
案例描述:
Docker命令执行,报错如下:
Cannot connect to the Docker daemon at unix:
///var/run/docker.sock. Is the docker daemon running?
根据如上错误提示,该错误很明显可能是docker没有启动。
解决方案:
检测docker进程是否启动,ps -ef|grep docker,如果没有启动,启动Docker即可。
检测Docker进程存在,但是无法连接,可以重启一下Docker服务,检测一下Sock路径是否正确;
— 故障排错案例5 —
案例描述:
Docker获取远程镜像,报错信息如下:
Get https://registry-1.docker.io/v2/: dial tcp: lookup registry-1.docker.io
该错误表示无法连接远程仓库Docker.io。
解决方案:
查看本地是否配置DNS,能否ping通docker.io;
如果能够ping通,但是下载还是比较慢,可以修改Docker仓库源为国内或者自建的仓库源;
Docker镜像修改方法,vim /etc/docker/daemon.json,执行如下命令:
at>/etc/docker/daemon.json<<EOF
{
"registry-mirrors":["https://registry.docker-cn.com"]
}
EOF
service docker restart
— 故障排错案例6 —
案例描述:
启动Docker容器,报错信息如下:
/usr/bin/docker-current: Error response from daemon: oci runtime error: container_linux.go:247: starting container process caused "exec: \"/bin/bash\": executable file not found in $PATH".
如上报错新,通常是由于容器启动时,不支持该命令:/bin/bash。
解决方案:
解决方法有如下两种:
修改启动命令为正确的Docker容器启动命令,例如修改为:/bin/sh或者sleep 99999d等;
Docker镜像自身问题或者Docker引擎版本比较低导致,可以升级Docker引擎版本服务;
— 故障排错案例7 —
案例描述:
Docker虚拟化运行中,报错信息如下:
Docker no space left on device
Docker no space left on device
Docker no space left on device
Docker no space left on device
Docker no space left on device
如上错误,表示Docker虚拟化引擎平台,没有多月的空间设备所使用,证明容器磁盘不足或者物理机磁盘不足。
解决方案:
手工删除Docker容器占用数据比较大的目录;
或者通过docker system prune自动删除一些日志目录,此种方法会停止所有容器;
或者临时增加Docker存储硬盘等;
— 故障排错案例8 —
案例描述:
Docker push上传镜像至本地仓库报错信息如下:
The push refers to a repository [106.12.133.186:5000/busybox] Get https://106.12.133.186:5000/v1/_ping: http: server gave HTTP response to HTTPS client
根据如上错误提示,错误是由于客户端采用https,docker registry未采用https服务所致。一种处理方式是把客户对地址“106.12.133.186:5000”请求改为http。
解决方案:
vim /etc/docker/daemon.json 文件。
在文件中写入:{ "insecure-registries":["106.12.133.186:5000"] } 。
保存退出后,重启docker服务,问题即可解决。
— 故障排错案例9 —
案例描述:
Error response from daemon: service endpoint with name xxx already ex
端口或服务已经被占用,目前试了网上的方法还没解决,方法只能重启了。
Docker常见故障的更多相关文章
- Weblogic常见故障常:JDBC Connection Pools(转)
WebLogic Server中数据库连接池是一个经常出问题的地方,总结一下出问题的原因和解决办法. 一.数据库连接泄漏 此类问题一般都是由于开发人员没有正确关闭数据库连接造成的.比如使用完Conne ...
- 理解 OpenStack + Ceph (7): Ceph 的基本操作和常见故障排除方法
本系列文章会深入研究 Ceph 以及 Ceph 和 OpenStack 的集成: (1)安装和部署 (2)Ceph RBD 接口和工具 (3)Ceph 物理和逻辑结构 (4)Ceph 的基础数据结构 ...
- Weblogic常见故障常:JDBC Connection Pools【转】
WebLogic Server中数据库连接池是一个经常出问题的地方,总结一下出问题的原因和解决办法. 一.数据库连接泄漏 此类问题一般都是由于开发人员没有正确关闭数据库连接造成的.比如使用完Conne ...
- (4.1)mysql备份还原——mysql常见故障
(4.1)mysql备份还原——mysql常见故障 1.常见故障类型 在数据库环境中,常见故障类型: 语句失败,用户进程失败,用户错误 实例失败,介质故障,网络故障 其中最严重的故障主要是用户错误和介 ...
- mysql主从复制常见故障解决
一.主从复制常见故障 1.从库已存在数据库,主库建立同名库导致从库同步失败.报错如下: mysql> show slave status\G*************************** ...
- vsftp客户连接常见故障现象
ftp客户连接常见故障现象现象0:> ftp: connect :连接被拒绝原因: 服务没启动解决: # chkconfig vsftpd on<Enter> 现象1:500 OOP ...
- (转)linux常见故障一:linux 文件系统变只读
linux常见故障一:linux 文件系统变只读 原文:https://www.cnblogs.com/ginvip/p/6375672.html 1. 重启系统看是否可以自动修复. 2. 使用fsc ...
- RAD介绍及实战,LVM介绍及实战,磁盘常见故障
目录 一.RAID 1.RAID好处: 2.RAID的运行方式: 3.RAID的级别: 二.RAID实战 软RAID 1.RAID0 2.RAID1 3.RAID5 4.RAID10 三.LVM介绍 ...
- 【集群实战】NFS服务常见故障排查和解决方法
NFS,全名叫Network File System,中文叫网络文件系统,是Linux.UNIX系统的分布式文件系统的一个组成部分,可实现在不同网络上共享远程文件系统. NFS由Sun公司开发,目前已 ...
随机推荐
- Docker快速入门(二)
上篇文章<Docker快速入门(一)>介绍了docker的基本概念和image的相关操作,本篇将进一步介绍image,容器和Dockerfile. 1 image文件 (1)Docker ...
- svn部署项目
svn部署项目 在svn服务器上文件夹拷入项目文件~然后直接检出文件夹~即可
- java面试总结
一.java的集合框架 HashMap.HashTable.CurrentHashMap的底层数据结构与区别? CurrentHashMap与HashTable是如何保证线程安全的? ArrayLis ...
- Django REST framework+Vue 打造生鲜超市(七)
目录 生鲜超市(一) 生鲜超市(二) 生鲜超市(三) 生鲜超市(四) 生鲜超市(五) 生鲜超市(六) 生鲜超市(七) 生鲜超市(八) 生鲜超市(九) 生鲜超市(十) ...
- 洛谷 P1054 解题报告
P1054 等价表达式 题目描述 明明进了中学之后,学到了代数表达式.有一天,他碰到一个很麻烦的选择题.这个题目的题干中首先给出了一个代数表达式,然后列出了若干选项,每个选项也是一个代数表达式,题目的 ...
- 洛谷 P1129 解题报告
P1129 [ZJOI2007]矩阵游戏 题目描述 小\(Q\)是一个非常聪明的孩子,除了国际象棋,他还很喜欢玩一个电脑益智游戏――矩阵游戏.矩阵游戏在一个\(N*N\)黑白方阵进行(如同国际象棋一般 ...
- TensorFlow-谷歌深度学习库 命令行参数
程序的入口: tf.app.run tf.app.run( main=None, argv=None ) 运行程序,可以提供'main'函数以及函数参数列表.处理flag解析然后执行main函数. 什 ...
- PAT1096:Consecutive Factors
1096. Consecutive Factors (20) 时间限制 400 ms 内存限制 65536 kB 代码长度限制 16000 B 判题程序 Standard 作者 CHEN, Yue A ...
- Visual Studio的常用快捷键
项目相关的快捷键 Ctrl + Shift + B 生成项目 Ctrl + Alt + L 显示Solution Explorer(解决方案资源管理器) Shift + Alt+ C 添加 ...
- PowerDesigner如何将设计的表更新到数据库中
前言: 软件开发的过程中,将设计的表更新到数据库中是一件繁琐的事情,使用好工具,能够事半功倍. 环境介绍:Oracle 11g x64 前期准备: 1.PowerDesigner工具(本人是32位的) ...