安装pre-flight

  master机器会安装上安装文件(同时check条件是否满足要求),其他的agent设备只是check各种条件是否具备。

  确保53/2181端口没有被占用;centos7每次启动机器都会启动dnsmasq服务(占用53端口),坑爹的是服务已经被disable,还是会被启动,估计是在rc.local里面做的。

deploy流程

  实时监控(包括定位问题):
 journalctl -xe -fu dcos-setup.service --no-pager

  需要detect脚本的py是这个,要读源码的看这:
  /opt/mesosphere/packages/exhibitor--5ecf040aa74a1c1f29ab543b4d5a23a738975c5f/usr/exhibitor/start_exhibitor.py

  NTP惹的祸

  Master之前的dcos-navstar.service服务异常,只是因为NTP服务没有启动;导致了部署失败;使得master节点以及一个agent节点,就是因为NTP没有启动,而挂在那里了。

操作

  成功后的联网问题

  部署成功后,可能将会要求你使用github,google,microsoft账号登录,但是登录之后爆出异常:
  Unable to login to your DC/OS cluster. Clusters must be connected to the internet.
  如果不想要认证,可以在安装的时候,不要勾选aunthentication选项(GUI安装页面的底部);或者是安装的配置文件中添加一句:
   oauth_enabled: false

  推测应该是只有企业版本才可以通过认证的方式来进行操作。

  记得关闭防火墙

  进入到了管理页面之后,发现一个节点总是连接不上,重启了dcos-spartan.service服务之后,发现重新注册,但是仍然是连接不上状态;后来发现原来这个节点的firewalld服务是打开的。

  扩展节点
  官网介绍地址:https://dcos.io/docs/1.10/administering-clusters/add-a-node/

  1.打包扩展安装包(其实就是把install以及配置文件打包)

   cd genconf/serve
  sudo tar cf dcos-install.tar *

  2. 在扩展节点上的准备工作

 sudo mkdir -p /opt/dcos_install_tmp
sudo tar xf dcos-install.tar -C /opt/dcos_install_tmp

  3. 启动
  private slave节点

sudo bash /opt/dcos_install_tmp/dcos_install.sh slave

  public slave节点
 sudo bash /opt/dcos_install_tmp/dcos_install.sh slave_public

调试

  日志排查

  定位问题,就是journalctl -fu XXX,XXX来自于systemctl | grep dcos,逐个排查。

  master部署后,频繁的看到下面的日志,期初以为是什么服务挂了,老重启,后来调查才发现:这是正常的是exhibitor周期性发送的连接,可以调周期(但是不知道在哪里调)。

  Accepted socket connection from /127.0.0.1:58444
  Processing srvr command from /127.0.0.1:58444
  [Thread-520:NIOServerCnxn@1044] - Closed socket connection for client /127.0.0.1:51144 (no session established for client)

重启

  重启dcos-mesos-slave-public/dcos-mesos-slave服务,遇到下面的问题,八成就是因为detect_ip脚本返回的不正确;
  ping: ready.spartan: Name or service not known
  

DCOS安装的更多相关文章

  1. DCOS(centos 7.4/7.6)

    https://dcos.io/releases/ https://downloads.dcos.io/dcos/stable/1.12.0/dcos_generate_config.sh https ...

  2. 原创docker dcos 的安装

    原创哈,上个星期无意间发现了一个可以好东西 DC/OS https://dcos.io 这个是官网哈 然后就痛苦的折磨了一个多星期; 基本是参照到https://dcos.io/docs/1.7/ad ...

  3. 安装DCOS,关于docker异常引发的调查

    入门DCOS,刚开始安装,碰到了一个异常: Bind for 0.0.0.0:9000 failed: port is already allocated. 调试这个问题花费了好长时间,因为无法通过n ...

  4. 使用ARM模板在Azure中国大规模部署DCOS集群

    容器技术是目前非常流行的技术,尤其是在以Docker作为容器引擎的推动下,让容器的轻量级,可移植,自包含,隔离性等的上了一个新的台阶,目前谈及Dev/Ops,CI/CD很少能够绕过Docker的. A ...

  5. linux ubuntu下如何安装并且切换java版本(Unsupported major.minor version 52.0)

    最近在做一个dcos(数据中心操作系统)的东西,需要用marathon来做进程管理.遗憾的是0.6版本的marathon在API方面很是缺少,换成了0.15版本之后,运行时提示“Unsupported ...

  6. 【 DCOS 】织云 CMDB 管理引擎技术详解

    欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 作者 : 李琦 , 腾讯高级工程师 , 就职于网络平台部.曾负责公司海量运营系统的规划设计,如 TMP.Sniper.GSLB.IDCSp ...

  7. DCOS实践分享(4):如何基于DC/OS整合SMACK(Spark, Mesos, Akka, Cassandra, Kafka)

    这篇文章入选CSDN极客头条 http://geek.csdn.net/news/detail/71572 当前,要保证业务的市场竞争力,仅靠设计一个可用并且好看的产品,已经完全不能满足要求.全球消费 ...

  8. DC/OS安装

    dc/os: https://dcos.io/ 安装文档-docker:https://docs.mesosphere.com/1.11/installing/oss/custom/system-re ...

  9. DCOS :私有云的物理基础架构管理引擎

    https://cloud.tencent.com/developer/article/1005598 一.引言 云计算经过多年的发展,逐渐从概念到渐为人认知.到接受.到现在全行业拥抱上云,云的客户也 ...

随机推荐

  1. 常用的机器学习&数据挖掘知识点

    Basis(基础):MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE ...

  2. 【HackerRank】Sherlock and Array

    Watson gives an array A1,A2...AN to Sherlock. Then he asks him to find if there exists an element in ...

  3. 【HackerRank】Utopian tree

    The Utopian tree goes through 2 cycles of growth every year. The first growth cycle of the tree occu ...

  4. FANCO工程机械云平台

    此系统专门为工程机械设备使用单位定制合理的生产要求,监控生产状况,快速体现产值,通过算法计算绩效等

  5. SDWebImage第三方库学习

    1.基本使用方法 //异步下载并缓存 - (void)sd_setImageWithURL:(nullable NSURL *)url NS_REFINED_FOR_SWIFT; //使用占位图片,当 ...

  6. iOS_SDWebImage框架分析

    SDWebImage 支持异步的图片下载+缓存,提供了 UIImageView+WebCacha 的 category,方便使用.使用SDWebImage首先了解它加载图片的流程. 入口 setIma ...

  7. avaweb学习总结(八)——HttpServletResponse对象(二)

    一.HttpServletResponse常见应用——生成验证码 1.1.生成随机图片用作验证码 生成图片主要用到了一个BufferedImage类,

  8. 吴恩达深度学习笔记(十二)—— Batch Normalization

        主要内容: 一.Normalizing activations in a network 二.Fitting Batch Norm in a neural network 三.Why does ...

  9. Xshell 5 上传下载插件

    #yum -y install lrzsz #rz 上传 sz用法: 下载一个文件 sz filename 下载多个文件 sz filename1 filename2 下载dir目录下的所有文件,不包 ...

  10. 通过代码或者配置文件 对log4net进行配置

    1.通过代码进行配置 1.1代码 http://stackoverflow.com/questions/16336917/can-you-configure-log4net-in-code-inste ...