dcos的问题汇总
. group 'docker' does not exist
需要手工创建docker组,这一步本来应该是在安装docker的时候来完成的,但是采用yum install的方式不行,需要添加一个docker的repo然后才能够安装。
2. ssh: connect to host 10.1.108.64 port 22: Operation timed out
重启服务器之后搞定了。为什么会出现这个问题,因为我谢了一个测试代码,set timeout=5,这个代码的起源是一段通过ssh远程登录的代码,通过set timeout来实现ssh超时设定,但是这个设定了之后影响是全局的。
3. FAIL(devicemapper,/dev/loop0)异常
dcos在check过程中将会把docker的存储方式修改为overlay,docker安装默认是devicemapper,如果修改后重启docker失败将会报此错误;所以通过service
docker
status来查看一下是否有drop-in以及override.conf,有的话,只需要重启docker服务即可自动更换存储格式,完事。如果还是devicemapper模式,则删掉/opt下面的dcos-reqinstalled文件即可,这样就会重新设置docker的存储模式。
4. 需要关闭端口
53 - 用于DNS
80
2181 -用于安装zookeeper
9990
5. 关于detect ip脚本
尽量保证网卡的名称一致,因为根据获取IP的脚本都是统一的根据网卡的名称来找对应的IP,这里应该写一个脚本保证网卡的名称一致。
在deplooy的时候发生了异常:
Error
executing DC/OS components health check: unable to execute GET
/system/health/v1: Get http://10.1.108.68:61001/system/health/v1: dial
tcp 10.1.108.68:61001: getsockopt: connection refused\" \n", "status": 1
但是这个只是表面现象,通过查询官网的Trouble Shooting,逐个排查组件,发现很可能是DNS的异常,因为组件中有如下异常:
ping: ready.spartan: Name or service not known
定位为题,查看日志:
systemctl | grep dcos
获取dcos的服务信息,根据官网的trouble shooting介绍进行逐个排查
journalctl -xe -u dcos-exhibitor.service --no-pager --since today
exhibitor组件根本没有日志,但是出于running状态;没有线索,看下一个,mesos-master(首先分析master机器,没有结果再分析agent机器)
journalctl -xe -u dcos-mesos-master --no-pager --since today
发现了一些问题:ping: ready.spartan: Name or service not known,spartan是mesos的DNS服务,这说明现在的DNS服务器有问题,下面再分析DNS服务(也是三个组件)
journalctl -xe -u dcos-mesos-dns.service --no-pager --since today
恩,找到了根源:Failed to start Mesos DNS: domain name based service discovery.
然后查看了一下
journalctl -flu dcos-spartan --no-pager
跟踪到了错误日志:
FileNotFoundError: [Errno 2] No such file or directory: '/var/lib/dcos/exhibitor/zk.pid'
之后的错误日志信息
Starting DNS Forwarder (Spartan): forwards DNS requests to multiple DNS servers...
dcos-spartan.service holdoff time over, scheduling restart.
Failed to load environment files: No such file or directory
dcos-spartan.service failed to run 'start-pre' task: No such file or directory
Failed to start DNS Forwarder (Spartan): forwards DNS requests to multiple DNS servers.
Unit dcos-spartan.service entered failed state.
dcos-spartan.service failed.(这部分日志比较具有迷惑性,什么意义也没有)
journalctl -flu dcos-adminrouter.service --no-pager
没有什么有价值的日志信息。
后来重启了dcos的master的核心服务exhibitor,才发现问题,不知为何直接采用上面提到的journalctl方式无法看到日志,知道重新启动服务后,才开始刷日志,根据日志信息知道了一个信息:脚本文件头少了"#!/bin/bash",添加后,再重启服务,才发现原来detectIP里面返回的IP地址为127.0.0.1或者是空,导致了失败;期初我的脚本是实现的从Linux全局变量中获取本机的IP信息,但是不知为何在脚本里面执行的时候,无法获得这个全局变量。
最后用了一种hack的方式,echo了本机的地址,但是这个问题要解决,后续会尝试一下官网的方案;
对于master而言exhibitor服务就是关键,他起来了,什么都OK了
之后报错:PermissionError: [Errno 13] Permission denied: '/var/lib/dcos/exhibitor/conf/log4j.properties'
一看conf目录下竟然没有log4j.properties,这是怎么回事呢?手动添加一个吧;还要+777,否则python不知为何向里面写东西没有权限;推测是因为第一次失败后,并没有创建改文件;因为正常安装这些文件都是由程序自己来创建的。
然后发现zookeeper无法启动:Unable to create parent directories of /var/lib/dcos/exhibitor/zookeeper/snapshot/myid,不知为何你到/var/lib/dcos/exhibitor下面看能够看到有的是dcos_exhibitor,有的是root权限,现在执行的应该是dcos_exhibitor用户,当然没有权限去想zookeeper里面去写了。
Group docker does not exist on the system
创建一个组,名字叫docker,也是醉了
deploy过程其实就是在执行了,Running Post-Flight其实就是在等结果
dcos的问题汇总的更多相关文章
- Golang优秀开源项目汇总, 10大流行Go语言开源项目, golang 开源项目全集(golang/go/wiki/Projects), GitHub上优秀的Go开源项目
Golang优秀开源项目汇总(持续更新...)我把这个汇总放在github上了, 后面更新也会在github上更新. https://github.com/hackstoic/golang-open- ...
- 常用 Gulp 插件汇总 —— 基于 Gulp 的前端集成解决方案(三)
前两篇文章讨论了 Gulp 的安装部署及基本概念,借助于 Gulp 强大的 插件生态 可以完成很多常见的和不常见的任务.本文主要汇总常用的 Gulp 插件及其基本使用,需要读者对 Gulp 有一个基本 ...
- 异常处理汇总 ~ 修正果带着你的Net飞奔吧!
经验库开源地址:https://github.com/dunitian/LoTDotNet 异常处理汇总-服 务 器 http://www.cnblogs.com/dunitian/p/4522983 ...
- UWP开发必备:常用数据列表控件汇总比较
今天是想通过实例将UWP开发常用的数据列表做汇总比较,作为以后项目开发参考.UWP开发必备知识点总结请参照[UWP开发必备以及常用知识点总结]. 本次主要讨论以下控件: GridView:用于显示数据 ...
- Oracle手边常用70则脚本知识汇总
Oracle手边常用70则脚本知识汇总 作者:白宁超 时间:2016年3月4日13:58:36 摘要: 日常使用oracle数据库过程中,常用脚本命令莫不是用户和密码.表空间.多表联合.执行语句等常规 ...
- Oracle 数据库知识汇总篇
Oracle 数据库知识汇总篇(更新中..) 1.安装部署篇 2.管理维护篇 3.数据迁移篇 4.故障处理篇 5.性能调优篇 6.SQL PL/SQL篇 7.考试认证篇 8.原理体系篇 9.架构设计篇 ...
- Vertica 数据库知识汇总篇
Vertica 数据库知识汇总篇(更新中..) 1.Vertica 集群软件部署,各节点硬件性能测试 2.Vertica 创建数据库,创建业务用户测试 3.Vertica 数据库参数调整,资源池分配 ...
- 读书笔记汇总 - SQL必知必会(第4版)
本系列记录并分享学习SQL的过程,主要内容为SQL的基础概念及练习过程. 书目信息 中文名:<SQL必知必会(第4版)> 英文名:<Sams Teach Yourself SQL i ...
- 关于DDD的学习资料汇总
DDD(Domain-Driven Design)领域驱动设计,第一次看到DDD是在学习ABP时,在其中的介绍中看到的.what,DDD是个什么鬼,我不是小白,是大白,没听过.于是乎,度娘查查查,找到 ...
随机推荐
- Spring MVC的视图解析器
一.视图解析器简介 在Spring MVC中,当Controller将请求处理结果放入到ModelAndView中以后,DispatcherServlet会根据ModelAndView选择合适的视图进 ...
- 九度OJ 1186:打印日期 (日期计算)
时间限制:1 秒 内存限制:32 兆 特殊判题:否 提交:6366 解决:2214 题目描述: 给出年分m和一年中的第n天,算出第n天是几月几号. 输入: 输入包括两个整数y(1<=y<= ...
- Python菜鸟之路:sqlalchemy/paramiko进阶
前言:ORM中的两种创建方式 数据库优先:指的是先创建数据库,包括表和字段的建立,然后根据数据库生成ORM的代码,它是先创建数据库,再创建相关程序代码 代码优先:就是先写代码,然后根据代码去生成数据库 ...
- Bootstrap学习4--Table样式(转载:https://blog.csdn.net/Fanbin168/article/details/53208869)
备注:最新Bootstrap手册:http://www.jqhtml.com/bootstraps-syntaxhigh/index.html 将<table>标签添加class=‘tab ...
- ADO.NET概述
xml这类文件它是.net变成环境中优先使用的数据访问借口. ADO.NET传输的数据都是XML格式的 ADO.NET是一组用于和数据源惊醒交互的面向对象类库 数据源:通常是各种数据库,但文本.exc ...
- linux基础part2
linux基础 一.linux基础命令 1.pwd:用来显示当前目录位置 2.cd:用来切换目录位置.(eg:cd...cd../...cd-.cd~) 3.ls:用来查看目录或文件信息(eg:ls ...
- zookeeper 实战案例分享:cruator客户端编程
上两篇介绍了zookeeper服务器端的安装和配置,今天分享下利用zookeeper客户端编程来实现配置文件的统一管理,包括文件添加.删除.更新的同步. 比如,连接数据库信息的配置文件,一般每个应用服 ...
- python有哪些关键字?让他自己“吐”出来!
通过调用库来输出!for循环控制! 源代码: import keyword c = 0 for i in keyword.kwlist: print(i) c += 1 代码截图: 哈哈,关键字: F ...
- hd acm 1297
问题:n个人排队,要求女生不能单独站,可以全是男生,可以全是女生. 例子:n=7,FFFF,FFMM,FFFM,MFFF,MMFF,MMMM,MFFM(F代表女生,M代表男生). 代码:(来自 蓝飞技 ...
- Java 9 逆天的十大新特性
在介绍java9之前,我们先来看看java成立到现在的所有版本. 1990年初,最初被命名为Oak: 1995年5月23日,Java语言诞生: 1996年1月,第一个JDK-JDK1.0诞生: 199 ...