基础点: CST  DC  MC主控节点配置文件:/etc/xdg/CST AG/CST  DC Main Control2013.conf

CST  DC SS求解器节点配置文件:/etc/xdg/CST AG/CST  DC Solver Control2013.conf

MC进程:lsb-cst-mainController2013

SS进程:lsb-cst-solverserver2013

工作路径:/tmp/CSTMainControllerWork2013

/tmp/CSTSolverServerWork2013

问题:CST的main controller 程序在大量程序仿真时会出现失去响应和崩溃

ssh到主控节点(比如节点名是mc06):ssh mc06

查看main controller进程状态:/etc/init.d/lsb-maincontroller2013 status

1提示Not running ,侧重新开启/etc/init.d/lsb-maincontroller2013 start

2提示is up and running ,则表示程序正在运行,但可能已无响应,这个时候手动结束main controller进程和重启进程

第一步:ps -ef | grep CSTDCMaincontroller.real   (查找到main controller进程的PID,可能会看到两个与main controller相关的进程,其中有一个进程是刚刚我们用grep 命令产生的进程,这个不用管它)

第二步:kill -9 pid  (杀掉main controller进程)

第三步:ps -ef | grep CSTDCMaincontroller.real    (重新确认系统已经没有main controller相关的进程了)

第四步:/etc/init.d/lsb-maincontroller2013 start  (重新再启动main controller 进程)

这个时候再重新连接主控节点MC06就应该能连接上了 。

超算CST DC分布式作业Main Controller 主控节点程序连接不上问题的更多相关文章

  1. 分布式作业 Elastic Job 如何动态调整?

    前面分享了两篇分布式作业调度框架 Elastic Job 的介绍及应用实战. ElasticJob-分布式作业调度神器 分布式作业 Elastic Job 快速上手指南! Elastic Job 提供 ...

  2. 分布式作业 Elastic-Job 快速上手指南,从理论到实战一文搞定!

    Elastic-Job支持 JAVA API 和 Spring 配置两种方式配置任务,这里我们使用 JAVA API 的形式来创建一个简单的任务入门,现在都是 Spring Boot 时代了,所以不建 ...

  3. 第五章 部署master主控节点

    一.部署etcd集群 1.1 集群规划 主机名 角色 IP hdss7-12 leader 10.4.7.12 hdss7-21 follow 10.4.7.21 hdss7-22 follow 10 ...

  4. [源码解析] PyTorch 分布式之弹性训练(7)---节点变化

    [源码解析] PyTorch 分布式之弹性训练(7)---节点变化 目录 [源码解析] PyTorch 分布式之弹性训练(7)---节点变化 0x00 摘要 0x01 变化方式 1.1 Scale-d ...

  5. DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路

    简介: 数据库将面临怎样的变革?云原生数据库与数据仓库有哪些独特优势?在日前的 DTCC 2020大会上,阿里巴巴集团副总裁.阿里云数据库产品事业部总裁.ACM杰出科学家李飞飞就<云原生分布式数 ...

  6. 用python + hadoop streaming 编写分布式程序(二) -- 在集群上运行与监控

    写在前面 相关随笔: Hadoop-1.0.4集群搭建笔记 用python + hadoop streaming 编写分布式程序(一) -- 原理介绍,样例程序与本地调试 用python + hado ...

  7. Kubernets二进制安装(7)之部署主控节点服务--apiserver简介

    API Server简介 Kubernetes API Server提供了K8S各类资源对象(如:pod.RC.Service等)的增删改查及watch等HTTP Rest接口,是整个系统的数据总线和 ...

  8. 编写一个带有main函数的类,调用上面的汽车类,实例化奔驰、大众、丰田等不同品牌和型号,模拟开车过程:启动、加速、转弯、刹车、息火,实时显示速度。

    //程序入口    public static void main(String[] args) {        // TODO Auto-generated method stub         ...

  9. 【JavaWEB SSH】jsp页面传值后台Controller 部分值绑定不上实体类

    //前端ajax代码 1 var oldpassword = $('#old_password').val(); var password = $('#L_pass').val(); var user ...

  10. Kubernets二进制安装(10)之部署主控节点部署调度器服务kube-scheduler

    Kubernetes Scheduler是一个策略丰富.拓扑感知.工作负载特定的功能,调度器显著影响可用性.性能和容量.调度器需要考虑个人和集体的资源要求.服务质量要求.硬件/软件/政策约束.亲和力和 ...

随机推荐

  1. 1+2+...+n

    时间限制:C/C++ 1秒,其他语言2秒 空间限制:C/C++ 32M,其他语言64M 题目描述 求1+2+3+...+n,要求不能使用乘除法.for.while.if.else.switch.cas ...

  2. (Pytorch第二天)CommandNotFoundError: Your shell has not been properly configured to use 'conda activate'.

    我在cmd里执行conda active,是没有问题的,但是在powershell里会报标题的错 按照各种提示以及查的资料,都说执行conda init 或者conda init cmd.exe等诸如 ...

  3. eclipse修改默认的工作空间路径

    搜索Workspaces -->勾选Prompt for workspace on startup

  4. 快速修改kafka的broker配置或topic配置

    下载开源的kafka界面客户端KafkaKing:https://github.com/Bronya0/Kafka-King 连接后,双击broker配置,或者双击topic配置: 修改好后回车保存就 ...

  5. css实现居中对齐的几种方式

    一般来说居中的话可分为水平居中与垂直居中,以下是我个人总结的几种方式 1.水平居中: inline元素:text-algin:center实现 block元素:margin:auto absolute ...

  6. Spring注解之@Value注解读取配置文件属性和设置默认值

    概述   在Spring 组件中,通常使用@Value注解读取 properties 文件的配置值.但如果在配置文件或启动参数中未指定对应的参数值,则项目在启动的时候会抛出异常,导致服务启动失败,异常 ...

  7. java LocalDateTime 加减当前时间

      LocalDateTime 可以对当前时间进行加减,在LocalDateTime类中,以plus打头的方法是增加某项时间,如plusDays的请求参数表示将要增加的天数,但是可以为负值:以minu ...

  8. 【TrafficMonitor】无法显示13代intel的CPU温度

    原因分析 TrafficMonitor的温度检测是利用了第三方软件LibreHardwareMonitor,并且这个问题可能与CPU有关 按照作者的指示,我们下载并启动了最新的LibreHardwar ...

  9. GStreamer开发笔记(五):gstreamer创建组件、管道和总线实现简单的播放器

    前言   前面是自动构建管道.本篇实例化每个元素并将它们链接在一起来手动构建一个管道.  本篇创建管道分为:创建组件,连接组件,获取总线,阻塞提取需要的消息并处理.   Demo      管道图   ...

  10. ABAP基础三——DIALOG整体

    本来想模拟VA01的,后来想想ME21N也很经典,所以就把一些常见的组建都放上面了. 效果图如下: 1.整体设计就是按  抬头(1) + 项目(N) + 伙伴(N) + 相关数据的tabstrip(N ...