问题

# cmcheckconf -v -C /etc/cmcluster/cmclconfig.ascii 
Begin cluster verification...  
Checking cluster file: /etc/cmcluster/cmclconfig.ascii  
Defaulting MAX_CONFIGURED_PACKAGES to 300.  
Checking nodes ... Done  
Checking existing configuration ... Done  
Defaulting MAX_CONFIGURED_PACKAGES to 300.  
Gathering storage information  
Unable to receive device query message from mucs3173: Software caused connection abort                                <--- 问题 
Found 148 devices on node mucs3088  
Found 148 devices on node mucs3090  
Found 150 devices on node mucs3091  
Found 0 devices on node mucs3173     <----------  这里 
Found 148 devices on node mucs3179  
Analysis of 594 devices should take approximately 16 seconds  
0%----10%----20%----30%----40%----50%----60%----70%----80%----90%----100%  
Found 59 volume groups on node mucs3088  
Found 59 volume groups on node mucs3090  
Found 59 volume groups on node mucs3091  
Found 0 volume groups on node mucs3173  
Found 59 volume groups on node mucs3179  
Analysis of 236 volume groups should take approximately 1 seconds  
0%----10%----20%----30%----40%----50%----60%----70%----80%----90%----100%  
Gathering network information  
Beginning network probing (this may take a while)  
Completed network probing  
Gathering polling target information  
cmcheckconf: Unable to reconcile configuration file /etc/cmcluster/cmclconfig.ascii

不管是在哪个节点运行 cmcheckconf ,结果都一样.

配置 :

HPUX 11.31.

Serviceguard:A.11.19和修补软件PHSS_40152(在受影响的节点上安装了PHSS_41162,但是没有帮助).

top

解决办法

mucs3173 syslog.log 中包含很多以下信息:

cmclconfd[29685]: Could not get vg (/dev/vg3139_TAQ_A) info: 3

使用 cmscancl 命令取得所有节点的 /etc/lvmtab 内容并且发现只有受影响的节点上有 vg3139_TAQ_A 和 vg3139_TAQ_old :

$ grep -e lvmtab -e vg3139_TAQ scancl.out  
------ Output of strings /etc/lvmtab (mucs3090) ------  
/dev/vg3139_TAQ 
------ Output of strings /etc/lvmtab (mucs3088) ------  
/dev/vg3139_TAQ 
------ Output of strings /etc/lvmtab (mucs3173) ------  
/dev/vg3139_TAQ_A      <---?? 
/dev/vg3139_TAQ_old    <---?? 
/dev/vg3139_TAQ     
------ Output of strings /etc/lvmtab (mucs3179) ------  
/dev/vg3139_TAQ 
------ Output of strings /etc/lvmtab (mucs3091) ------  
/dev/vg3139_TAQ

如果加上 -k 选项cmcheckconf 会顺利执行. 这个选项消除了检查LVM磁盘, 所以这就确定了问题和LVM问题有关系.

动作 :

  • • 检查 /dev/vg3139_TAQ_A 是否存在于受影响的节点上.

  • 如果卷组 vg3139_TAQ_A 不需要了, vgexport 它.

效果 :

vgexport 解决了问题.

地址:http://h20566.www2.hp.com/portal/site/hpsc/template.PAGE/public/kb/docDisplay?javax.portlet.begCacheTok=com.vignette.cachetoken&javax.portlet.endCacheTok=com.vignette.cachetoken&javax.portlet.prp_ba847bafb2a2d782fcbb0710b053ce01=wsrp-navigationalState%3DdocId%253Demr_na-c02491156-1%257CdocLocale%253D%257CcalledBy%253D&javax.portlet.tpst=ba847bafb2a2d782fcbb0710b053ce01&sp4ts.oid=4162060&ac.admitted=1408344051145.876444892.199480143

HP 集群软件 - 不能接收节点的设备查询信息:软件引起的连接失败的更多相关文章

  1. elasticsearch介绍集群,模拟横向扩展节点、节点宕机、改变分片

        出处:[http://www.cnblogs.com/dennisit/p/4133131.html] ,防楼主删博,故保留一份! elasticsearch用于构建高可用和可扩展的系统.扩展 ...

  2. Kubernetes集群部署之五node节点部署

    Node节点是Kubernetes集群中的工作负载节点.每个node都会被master分配一些工作负载,每个node节点都运行以下关键服务进程.Kubelet :负责pod对应的容器的创建.启停等任务 ...

  3. 学习MongoDB(三) Add an Arbiter to Replica Set 集群中加入仲裁节点

    Add an Arbiter to Replica Set 在集群中加入仲裁节点,当集群中主节点挂掉后负责选出新的主节点,仲裁节点也是一个mongo实力,但是它不存储数据. 1.仲裁节点消耗很小的资源 ...

  4. Hadoop概念学习系列之Hadoop集群动态增加新节点或删除已有某节点及复制策略导向 (四十三)

    不多说,直接上干货! hadoop-2.6.0动态添加新节点 https://blog.csdn.net/baidu_25820069/article/details/52225216 Hadoop集 ...

  5. 使用 kubectl drain 从集群中移除节点

    对节点执行维护操作之前(例如:内核升级,硬件维护等),您可以使用 kubectl drain 安全驱逐节点上面所有的 pod.安全驱逐的方式将会允许 pod 里面的容器遵循指定的 PodDisrupt ...

  6. 第九章:Elasticsearch集群优化及相关节点配置说明

    Linux系统调优: Linux调整打开文件数(重新启动生效) 在/etc/security/limits.conf在文件中增加: * soft nofile 8192 * hard nofile 2 ...

  7. apache-storm-1.0.2.tar.gz的集群搭建(3节点)(图文详解)(非HA和HA)

    不多说,直接上干货! Storm的版本选取 我这里,是选用apache-storm-1.0.2.tar.gz apache-storm-0.9.6.tar.gz的集群搭建(3节点)(图文详解) 为什么 ...

  8. redis集群(单机6节点实现)

    Redis集群搭建与简单使用 1.介绍安装环境与版本: 1)Redis使用的是Redis-3.2.8版本. 2)用一台虚拟机模拟6个节点,三个master节点,三个slave节点.虚拟机使用CentO ...

  9. Kubernetes容器集群管理环境 - Node节点的移除与加入

    一.如何从Kubernetes集群中移除Node比如从集群中移除k8s-node03这个Node节点,做法如下: 1)先在master节点查看Node情况 [root@k8s-master01 ~]# ...

随机推荐

  1. hdu 4004 (二分加贪心) 青蛙过河

    题目传送门:http://acm.hdu.edu.cn/showproblem.php?pid=4004 题目意思是青蛙要过河,现在给你河的宽度,河中石头的个数(青蛙要从石头上跳过河,这些石头都是在垂 ...

  2. 希尔排序和归并排序(java实现)

    希尔排序 希尔排序算法实际上是一种特殊的插入排序,由DL.Shell于1959年提出而得名. 算法思想:希尔排序使数组中任意间隔为h的元素都是有序的,这些数组称为h有序数组,对于每个h,按插入排序进行 ...

  3. svn 回滚文件修改

    取消对代码的修改分为两种情况:   第一种情况:改动没有被提交(commit). 这种情况下,使用svn revert就能取消之前的修改. svn revert用法如下: # svn revert [ ...

  4. qRT-PCR 注意事项

    师姐呕心沥血整理的 qRT-PCR 注意事项 关键词: qRT-PCR 注意事项2017-07-17 10:17 来源:生物学霸 点击次数:1257 大家都在说 qRT-PCR 实验原理.引物设计.结 ...

  5. BZOJ3191或洛谷2059 [JLOI2013]卡牌游戏

    BZOJ原题链接 洛谷原题链接 我们可以倒着来\(DP\). 设\(f[i][j]\)表示剩余\(i\)个人,从庄家数起第\(j\)个人的胜率,设当前枚举到第\(k\)张牌,该情况下这一轮淘汰的位置为 ...

  6. django POST表单的使用

    环境如下:django 1.7.8 版本. 1.在POST表单的时候会出现这个错误提示. 禁止访问 (403) CSRF验证失败. 相应中断. Help Reason given for failur ...

  7. Linux下文件的三种时间标记(atime ctime mtime)

    在windows下,一个文件有:创建时间.修改时间.访问时间. 在Linux下,一个文件有:状态改动时间.修改时间.访问时间. 1)查看文件(或文件夹)的三种时间标记 (stat 命令) Access ...

  8. android DatagramSocket send 发送数据出错

    安卓4.0以后好像不能在主线程里面使用 socket 所以不管是发送数据还是接收数据需要新开一个了线程: 以下代码是我点击发送是代码: new Thread(new Runnable() { @Ove ...

  9. 解决maven update project 后项目jdk变成1.5的问题

    一.问题描述 在Eclipse中新建了一个Maven工程, 然后更改JDK版本为1.7, 结果每次使用Maven > Update project的时候JDK版本都恢复成1.5. 二.原因分析 ...

  10. Java crash问题分析

    Java的应用有时候会因为各种原因Crash,这时候会产生一个类似java_errorpid.log的错误日志.可以拿到了 这个日志,怎样分析Crash的原因呢?下面我们来详细讨论如何分析java_e ...