AIX下解决POWERHA的脑裂问题
一、安装创建并发vg时必需的软件包clvm包,该包安装、升级、后必须重启os
clvm包的描述:Enhanced Concurrent Logical Volume Manager
软件包在aix6100-dvd1.iso中:安装时进入到installp/ppc目录下执行安装
软件包升级在6106中:升级时使用指令smitty update_all 直接选择全部升级到最新版 本,不支持选择部分软件包升级,系统只支持相关软件包全部升级
二、确定共享存储
确定共享存储的方法有三种:
方法一:
在共享存储的服务器上lspv,如果对应hdiskn的PVID是相同的就可以确定为 是 共享存储
另外执行指令:bootinfo -s hdiskn,查看下对应存储的大小,共享存储的大小必定 是相同的
方法二:
只针对IBM的存储才能生效,只对IBM的DS系统存储才能生效
执行指令:mpio_get_config -Av

显示结果中的 User Label列值是唯一的,在211和212机器上同时执行该指令,
如果对应hdiskn的 User Lablel列值相同,就说明是共享存储
方法三:
使用dbh_read指令,使用该指令前要确保共享存储上没有做心跳磁盘,否则就将 测试信息写入共享存储的磁盘头了
在211端: /usr/sbin/rsct/bin/dhb_read -p hdisk8 -r 进入信息receive状态
在212端: /usr/sbin/rsct/bin/dhb_read -p hdisk8 -t 进入信息transate状态
如果在211端能成功接收到212端发送的测试信息,就说明hdisk8盘是共享 存储
【漫兮网(http://www.manxinet.com)】
三、创建并发VG,做磁盘心跳
1、在211下创建hboravg 类型为enhanced concurrent 增加型并发vg,同时选择不自 动active,并发vg做磁盘心跳只是使用了并发vg的vgda区,只使用磁盘头,不用 设置系统重启时自动激活,
2、在211下:在并发vg下创建测试lv,目的是测试是否成功创建了并发vg,即该vg 是否可用做 为并发vg来用, lv名称: sychlv
在创建lv前需要先activevg : varyonvg hboravg
然后创建lv : smitty mklv
3、211下:
deactive vg : varyoffvg hboravg
4、在212下导入:
导入vg : Importvg -V mainNum -y hboravg
在212下能够正常显示vg中的lv,通常是lv的type显示不是??就可以判定为正 常
5、211和212端全部deactive vg
执行指令 :varyoffvg hboravg
【漫兮网(http://www.manxinet.com)】
四、启动集群,激活gsclvmd进程,通过该进程来active并发vg,测试vg是否可以同步
1、启动集群,因为varyonvg -c hboravg激活到enhanced concurrent模式时必须有gsclvmd 进程,但是gsclvmd进程是由ha启动的,所以在激活前必须有gsclvmd进程存在
查看进程指令:ps -ef | grep gsclvmd
2、激活vg到enhanced concurrent模式
211和212端全部执行指令:varyonvg -c hboravg
vg激活后显示的状态不是active而是concurrent
3、测试是否是并发vg
在211端创建testlv,正常情况应该是自动同步到212端
在212端显示vg的情况:lsvg -l hboravg
应该可以显示出在211端创建的lv,正常情况自动推送到212端
在212下:
cd /dev
ls -l *test*
可以正常显示vg和lv对应的设备文件
五、添加并发vg到ha中,测试心跳是否成功
1、直接添加Configure HACMP Communication Interfaces/Devices
选择: Devices
选择: aix211 hdisk8 和aix212 hdisk8
2、同步集群
3、测试
(i)资源组目前运行在211上,
ifconfig en0 down :资源切到了211的en1网卡上
ifconfig en1 down :资源应该切换到212的en0上,同时seviceIP在211上消 失
(ii)在212下,查看并确认资源切换是否成功,心跳是否成功
在212端: ifconfig -a |service IP资源应该可以成功切换到212上
重启211的两个网卡en0和en1,资源仍然正常运行在212节点上,并且212节点 不会死机,应该可以正常接管资源组。
【漫兮网(http://www.manxinet.com)】
六、HA脑裂问题解决
总结:
整个过程操作顺序:
创建hboravg---->创建cluster--->add node--->descover---->add network-->add interface--
-->config resource --->add resource group --->资源装车show/change---->同步集群到 各个节点---->启动集群---->varyonvg -c hboravg启动到Enhanced Concurrent模式---
---->创建测试lv验证并发vg----add device hdisk8(心跳磁盘)---->同步集群到各个节点
--->down网卡测试心跳盘是否生效
本文由漫兮 首发于【漫兮网(http://www.manxinet.com)】--转载请注明【漫兮网】
AIX下解决POWERHA的脑裂问题的更多相关文章
- 为 Raft 引入 leader lease 机制解决集群脑裂时的 stale read 问题
问题:当 raft group 发生脑裂的情况下,老的 raft leader 可能在一段时间内并不知道新的 leader 已经被选举出来,这时候客户端在老的 leader 上可能会读取出陈旧的数据( ...
- nginx;keepalived配置出现主主的解决方法(脑裂问题)
1.查看日志 tail -f /var/log/messages 发现master和backup机都是mastaer模式启动的 通过查看别人的经历,发现VRRP基于报文实现的.master设置一定时间 ...
- keepalived的脑裂问题与解决
Keepalived的作用是检测服务器的状态,如果有一台web服务器宕机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工 ...
- AIX下的ha高可用集群cluster
安装ha软件 一.安装软件 最稳定的版本是5.4.0,优先安装稳定版本5.4 安装依赖于包base.data, cluster的man包安装失败原因是缺少base.data包 安装所有cluster. ...
- 脑裂 CAP PAXOS 单元化 网络分区 最终一致性 BASE
阿里技术专家甘盘:浅谈双十一背后的支付宝LDC架构和其CAP分析 https://mp.weixin.qq.com/s/Cnzz5riMc9RH19zdjToyDg 汤波(甘盘) 技术琐话 2020- ...
- 脑裂是什么?Zookeeper是如何解决的?
什么是脑裂 脑裂(split-brain)就是"大脑分裂",也就是本来一个"大脑"被拆分了两个或多个"大脑",我们都知道,如果一个人有多个大 ...
- mfs分布式文件系统,分布式存储,高可用(pacemaker+corosync+pcs),磁盘共享(iscsi),fence解决脑裂问题
一.MFS概述 MooseFS是一个分布式存储的框架,其具有如下特性:(1)通用文件系统,不需要修改上层应用就可以使用(那些需要专门api的dfs很麻烦!).(2)可以在线扩容,体系架构可伸缩性极强. ...
- 【Redis集群原理专题】分析一下相关的Redis集群模式下的脑裂问题!
技术格言 世界上并没有完美的程序,但是我们并不因此而沮丧,因为写程序就是一个不断追求完美的过程. 什么是脑裂 字面含义 首先,脑裂从字面上理解就是脑袋裂开了,就是思想分家了,就是有了两个山头,就是有了 ...
- 解决Linux/aix 下的websphere log4j不生效
websphere 解决Linux/aix下的log4j不生效 在目录: /IBM/WebSphere/AppServer/profiles/AppSrv01/properties 增加一个文件:可以 ...
随机推荐
- win7下安装搭建PHP环境
由于最近新找的工作要求php,所以在电脑上安装搭建了PHP环境.主要参考了这篇文章http://www.leapsoul.cn/?p=695(之前第一次搭建时由于版本问题没有弄好) 1.先装apach ...
- IE6~9的css hack写法
_color: red; /* ie6 */ *color: red; /* ie6/7 */ +color: red; /* ie6/7 */ color: red\0; /* ie8/9 */ c ...
- javascript版QQ在线聊天挂件
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
- 使用Android平板编程,执行linux命令
android有一些应用支持开发, AIDE 介绍http://www.wandoujia.com/apps/com.aide.ui https://play.google.com/store/app ...
- Python函数小结(1)--参数类型(*, ** 的区别), 闭包
刚开始学习python,python相对于java确实要简洁易用得多.内存回收类似hotspot的可达性分析, 不可变对象也如同java得Integer类型,with函数类似新版本C++的特性,总体来 ...
- Unity脚本的生命周期中几个重要的方法
1.function Update () {} 正常更新,用于更新逻辑.此方法每帧都会由系统自动调用一次.2.function LateUpdate () {} 推迟更新,此方法在Update() 方 ...
- 单例模式 - OK
单例模式(Singleton):保证一个类仅有一个实例,并提供一个访问它的全局访问点. 一.单例模式 通常我们可以让一个全局变量使得一个对象被访问,但它不能防止你实例化多个对象.一个最好的办法就是,让 ...
- SSH自动部署(转)
我的是windows环境,目前开发的过程中,有些项目需要一下子部署到很多的linux服务器上.写了个脚本能够自动上传文件和执行部署任务.完成这个任务需要的条件包括SSH配置和一个执行脚本. 准备 1. ...
- 韩顺平HTML5教程www.gis520.com
传智播客.韩顺平.HTML5游戏公开课-坦克大战01.HTML5介绍.HTML5发展.HTML5学习网站推荐.wmv http://dl.vmall.com/c0b7xrkftf 传智播客.韩顺平.H ...
- hdu4085
http://acm.hdu.edu.cn/showproblem.php?pid=4085 斯坦纳树. 用状压DP. 一共有2K个关键点:1,2...,K和N-K+1,N-K+2...,N,我们用一 ...