DCOS安装
安装pre-flight
master机器会安装上安装文件(同时check条件是否满足要求),其他的agent设备只是check各种条件是否具备。
确保53/2181端口没有被占用;centos7每次启动机器都会启动dnsmasq服务(占用53端口),坑爹的是服务已经被disable,还是会被启动,估计是在rc.local里面做的。
deploy流程
实时监控(包括定位问题):
journalctl -xe -fu dcos-setup.service --no-pager
需要detect脚本的py是这个,要读源码的看这:
/opt/mesosphere/packages/exhibitor--5ecf040aa74a1c1f29ab543b4d5a23a738975c5f/usr/exhibitor/start_exhibitor.py
NTP惹的祸
Master之前的dcos-navstar.service服务异常,只是因为NTP服务没有启动;导致了部署失败;使得master节点以及一个agent节点,就是因为NTP没有启动,而挂在那里了。
操作
成功后的联网问题
部署成功后,可能将会要求你使用github,google,microsoft账号登录,但是登录之后爆出异常:
Unable to login to your DC/OS cluster. Clusters must be connected to the internet.
如果不想要认证,可以在安装的时候,不要勾选aunthentication选项(GUI安装页面的底部);或者是安装的配置文件中添加一句:
oauth_enabled: false
推测应该是只有企业版本才可以通过认证的方式来进行操作。
记得关闭防火墙
进入到了管理页面之后,发现一个节点总是连接不上,重启了dcos-spartan.service服务之后,发现重新注册,但是仍然是连接不上状态;后来发现原来这个节点的firewalld服务是打开的。
扩展节点
官网介绍地址:https://dcos.io/docs/1.10/administering-clusters/add-a-node/
1.打包扩展安装包(其实就是把install以及配置文件打包)
cd genconf/serve
sudo tar cf dcos-install.tar *
2. 在扩展节点上的准备工作
sudo mkdir -p /opt/dcos_install_tmp
sudo tar xf dcos-install.tar -C /opt/dcos_install_tmp
3. 启动
private slave节点
sudo bash /opt/dcos_install_tmp/dcos_install.sh slave
public slave节点
sudo bash /opt/dcos_install_tmp/dcos_install.sh slave_public
调试
日志排查
定位问题,就是journalctl -fu XXX,XXX来自于systemctl | grep dcos,逐个排查。
master部署后,频繁的看到下面的日志,期初以为是什么服务挂了,老重启,后来调查才发现:这是正常的是exhibitor周期性发送的连接,可以调周期(但是不知道在哪里调)。
Accepted socket connection from /127.0.0.1:58444
Processing srvr command from /127.0.0.1:58444
[Thread-520:NIOServerCnxn@1044] - Closed socket connection for client /127.0.0.1:51144 (no session established for client)
重启
重启dcos-mesos-slave-public/dcos-mesos-slave服务,遇到下面的问题,八成就是因为detect_ip脚本返回的不正确;
ping: ready.spartan: Name or service not known
DCOS安装的更多相关文章
- DCOS(centos 7.4/7.6)
https://dcos.io/releases/ https://downloads.dcos.io/dcos/stable/1.12.0/dcos_generate_config.sh https ...
- 原创docker dcos 的安装
原创哈,上个星期无意间发现了一个可以好东西 DC/OS https://dcos.io 这个是官网哈 然后就痛苦的折磨了一个多星期; 基本是参照到https://dcos.io/docs/1.7/ad ...
- 安装DCOS,关于docker异常引发的调查
入门DCOS,刚开始安装,碰到了一个异常: Bind for 0.0.0.0:9000 failed: port is already allocated. 调试这个问题花费了好长时间,因为无法通过n ...
- 使用ARM模板在Azure中国大规模部署DCOS集群
容器技术是目前非常流行的技术,尤其是在以Docker作为容器引擎的推动下,让容器的轻量级,可移植,自包含,隔离性等的上了一个新的台阶,目前谈及Dev/Ops,CI/CD很少能够绕过Docker的. A ...
- linux ubuntu下如何安装并且切换java版本(Unsupported major.minor version 52.0)
最近在做一个dcos(数据中心操作系统)的东西,需要用marathon来做进程管理.遗憾的是0.6版本的marathon在API方面很是缺少,换成了0.15版本之后,运行时提示“Unsupported ...
- 【 DCOS 】织云 CMDB 管理引擎技术详解
欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 作者 : 李琦 , 腾讯高级工程师 , 就职于网络平台部.曾负责公司海量运营系统的规划设计,如 TMP.Sniper.GSLB.IDCSp ...
- DCOS实践分享(4):如何基于DC/OS整合SMACK(Spark, Mesos, Akka, Cassandra, Kafka)
这篇文章入选CSDN极客头条 http://geek.csdn.net/news/detail/71572 当前,要保证业务的市场竞争力,仅靠设计一个可用并且好看的产品,已经完全不能满足要求.全球消费 ...
- DC/OS安装
dc/os: https://dcos.io/ 安装文档-docker:https://docs.mesosphere.com/1.11/installing/oss/custom/system-re ...
- DCOS :私有云的物理基础架构管理引擎
https://cloud.tencent.com/developer/article/1005598 一.引言 云计算经过多年的发展,逐渐从概念到渐为人认知.到接受.到现在全行业拥抱上云,云的客户也 ...
随机推荐
- 【Tech】CAS多机部署Server和Java Client端
昨天尝试把cas的java client端部署到另外一台机器,结果就有问题了.(localhost部署cas server和java client端参见:http://www.cnblogs.com/ ...
- Android BlueDroid(蓝牙协议栈)
Android BlueDroid(一):BlueDroid概述 Android BlueDroid(二):BlueDroid蓝牙开启过程init Android BlueDroid(三):BlueD ...
- 快乐学习 Ionic Framework+PhoneGap 手册1-3 {面板切换}
编程的快乐和乐趣,来自于能成功运行程序并运用到项目中,会在后面案例,实际运用到项目当中与数据更新一起说明 从面板切换开始,请看效果图和代码,这只是一个面板切换的效果 Index HTML Code & ...
- mongodb中的__v字段
"__v"是"versionKey"的简写,当每一个文档由mongoose创建时就会自动添加,代表这该文档的版本,此属性可配置修改,默认为"__v&q ...
- Unity发布安卓后,安卓输入键盘字体白色
项目里需要用到显示手机电池电量的,但是又不想写安卓,倒jar包,还要做配置,还要写IOS,好麻烦的说.一查,unity后期版本有这个API,索性就升级高版本的了.但是遇到个小问题,那就是安卓输入的时候 ...
- poj 3468 线段树模板题
#include<iostream> #include<algorithm> #include<stdio.h> using namespace std; #def ...
- XML 的解析方法
四种XML解析方法: (1)Dom生成和解析XML文档 *解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构. * 优点:整个文档树在内存中,便 ...
- RabbitMQ解决分布式事务
案例:经典案例,以目前流行点外卖的案例,用户下单后,调用订单服务,让后订单服务调用派单系统通知送外卖人员送单,这时候订单系统与派单系统采用MQ异步通讯. RabbitMQ解决分布式事务原理: 采用最终 ...
- ASP.NET上传文件,已经上传的大小保存在session中,在另一个页面中读取session的值不行
想自己做个ASP.NET上传文件时显示进度条的, 按照自己的想法,其实也就是显示每次已经上传的字节,从网上找到一个方法是能够把文件变成流以后再慢慢写入的,我在那个循环写入的时候每循环一次都把已经上传的 ...
- tensorflow笔记:流程,概念和简单代码注释
tensorflow是google在2015年开源的深度学习框架,可以很方便的检验算法效果.这两天看了看官方的tutorial,极客学院的文档,以及综合tensorflow的源码,把自己的心得整理了一 ...