一、安装创建并发vg时必需的软件包clvm包,该包安装、升级、后必须重启os

clvm包的描述:Enhanced Concurrent Logical Volume Manager

软件包在aix6100-dvd1.iso中:安装时进入到installp/ppc目录下执行安装

软件包升级在6106中:升级时使用指令smitty update_all 直接选择全部升级到最新版    本,不支持选择部分软件包升级,系统只支持相关软件包全部升级

二、确定共享存储

确定共享存储的方法有三种:

方法一:

在共享存储的服务器上lspv,如果对应hdiskn的PVID是相同的就可以确定为    是              共享存储

另外执行指令:bootinfo -s hdiskn,查看下对应存储的大小,共享存储的大小必定                       是相同的

方法二:

只针对IBM的存储才能生效,只对IBM的DS系统存储才能生效

执行指令:mpio_get_config -Av

显示结果中的 User Label列值是唯一的,在211和212机器上同时执行该指令,

如果对应hdiskn的 User Lablel列值相同,就说明是共享存储

方法三:

使用dbh_read指令,使用该指令前要确保共享存储上没有做心跳磁盘,否则就将                      测试信息写入共享存储的磁盘头了

在211端:     /usr/sbin/rsct/bin/dhb_read -p hdisk8 -r 进入信息receive状态

在212端:  /usr/sbin/rsct/bin/dhb_read -p hdisk8 -t  进入信息transate状态

如果在211端能成功接收到212端发送的测试信息,就说明hdisk8盘是共享                                 存储

漫兮网(http://www.manxinet.com)】

三、创建并发VG,做磁盘心跳

1、在211下创建hboravg 类型为enhanced concurrent 增加型并发vg,同时选择不自                        动active,并发vg做磁盘心跳只是使用了并发vg的vgda区,只使用磁盘头,不用               设置系统重启时自动激活,

2、在211下:在并发vg下创建测试lv,目的是测试是否成功创建了并发vg,即该vg                        是否可用做                       为并发vg来用, lv名称: sychlv

在创建lv前需要先activevg : varyonvg hboravg

然后创建lv                                 :  smitty mklv

3、211下:

deactive vg            :  varyoffvg hboravg

4、在212下导入:

导入vg               : Importvg -V mainNum -y hboravg

在212下能够正常显示vg中的lv,通常是lv的type显示不是??就可以判定为正            常

5、211和212端全部deactive vg

执行指令                            :varyoffvg hboravg

漫兮网(http://www.manxinet.com)】

四、启动集群,激活gsclvmd进程,通过该进程来active并发vg,测试vg是否可以同步

1、启动集群,因为varyonvg -c hboravg激活到enhanced concurrent模式时必须有gsclvmd       进程,但是gsclvmd进程是由ha启动的,所以在激活前必须有gsclvmd进程存在

查看进程指令:ps  -ef | grep gsclvmd

2、激活vg到enhanced concurrent模式

211和212端全部执行指令:varyonvg -c hboravg

vg激活后显示的状态不是active而是concurrent

3、测试是否是并发vg

在211端创建testlv,正常情况应该是自动同步到212端

在212端显示vg的情况:lsvg -l  hboravg

应该可以显示出在211端创建的lv,正常情况自动推送到212端

在212下:

cd  /dev

ls  -l *test*

可以正常显示vg和lv对应的设备文件

五、添加并发vg到ha中,测试心跳是否成功

1、直接添加Configure HACMP Communication Interfaces/Devices

选择:  Devices

选择: aix211 hdisk8 和aix212 hdisk8

2、同步集群

3、测试

(i)资源组目前运行在211上,

ifconfig en0 down :资源切到了211的en1网卡上

ifconfig en1 down :资源应该切换到212的en0上,同时seviceIP在211上消                       失

(ii)在212下,查看并确认资源切换是否成功,心跳是否成功

在212端: ifconfig -a  |service IP资源应该可以成功切换到212上

重启211的两个网卡en0和en1,资源仍然正常运行在212节点上,并且212节点            不会死机,应该可以正常接管资源组。

漫兮网(http://www.manxinet.com)】

六、HA脑裂问题解决

总结:

整个过程操作顺序:

创建hboravg---->创建cluster--->add node--->descover---->add network-->add interface--

-->config resource --->add resource group --->资源装车show/change---->同步集群到                各个节点---->启动集群---->varyonvg -c hboravg启动到Enhanced Concurrent模式---

---->创建测试lv验证并发vg----add device hdisk8(心跳磁盘)---->同步集群到各个节点

--->down网卡测试心跳盘是否生效

本文由漫兮 首发于【漫兮网(http://www.manxinet.com)】--转载请注明【漫兮网

AIX下解决POWERHA的脑裂问题的更多相关文章

  1. 为 Raft 引入 leader lease 机制解决集群脑裂时的 stale read 问题

    问题:当 raft group 发生脑裂的情况下,老的 raft leader 可能在一段时间内并不知道新的 leader 已经被选举出来,这时候客户端在老的 leader 上可能会读取出陈旧的数据( ...

  2. nginx;keepalived配置出现主主的解决方法(脑裂问题)

    1.查看日志 tail -f /var/log/messages 发现master和backup机都是mastaer模式启动的 通过查看别人的经历,发现VRRP基于报文实现的.master设置一定时间 ...

  3. keepalived的脑裂问题与解决

    Keepalived的作用是检测服务器的状态,如果有一台web服务器宕机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工 ...

  4. AIX下的ha高可用集群cluster

    安装ha软件 一.安装软件 最稳定的版本是5.4.0,优先安装稳定版本5.4 安装依赖于包base.data, cluster的man包安装失败原因是缺少base.data包 安装所有cluster. ...

  5. 脑裂 CAP PAXOS 单元化 网络分区 最终一致性 BASE

    阿里技术专家甘盘:浅谈双十一背后的支付宝LDC架构和其CAP分析 https://mp.weixin.qq.com/s/Cnzz5riMc9RH19zdjToyDg 汤波(甘盘) 技术琐话 2020- ...

  6. 脑裂是什么?Zookeeper是如何解决的?

    什么是脑裂 脑裂(split-brain)就是"大脑分裂",也就是本来一个"大脑"被拆分了两个或多个"大脑",我们都知道,如果一个人有多个大 ...

  7. mfs分布式文件系统,分布式存储,高可用(pacemaker+corosync+pcs),磁盘共享(iscsi),fence解决脑裂问题

    一.MFS概述 MooseFS是一个分布式存储的框架,其具有如下特性:(1)通用文件系统,不需要修改上层应用就可以使用(那些需要专门api的dfs很麻烦!).(2)可以在线扩容,体系架构可伸缩性极强. ...

  8. 【Redis集群原理专题】分析一下相关的Redis集群模式下的脑裂问题!

    技术格言 世界上并没有完美的程序,但是我们并不因此而沮丧,因为写程序就是一个不断追求完美的过程. 什么是脑裂 字面含义 首先,脑裂从字面上理解就是脑袋裂开了,就是思想分家了,就是有了两个山头,就是有了 ...

  9. 解决Linux/aix 下的websphere log4j不生效

    websphere 解决Linux/aix下的log4j不生效 在目录: /IBM/WebSphere/AppServer/profiles/AppSrv01/properties 增加一个文件:可以 ...

随机推荐

  1. 在Yii2中使用Pjax导致Yii2内联脚本载入失败的问题

    当我用defunkt/jquery-pjax载入Yii2的ActiveForm时发生一个错误,正常情况下是 ActiveForm的两个js应该先载入,而实际情况是 typeError:JQuery(. ...

  2. android手机获取手机号

    最近做到一个项目,需要获取手机号.项目中使用的手机卡为电信卡,那么就以此为例吧. 网上不符合需求的方法 Google了一下,网上的做法如下: //获取手机号码 TelephonyManager tm  ...

  3. python修改txt文件内容

    ①以r模式打开文件并用readlines方法读入列表l中 ②修改相关行,直接用l[n]形式即可 ③关闭文件 ④以w方式打开文件,用writelines方法写入文件(覆盖文件内容) ⑤关闭文件 需要注意 ...

  4. .NET MVC权限控制

    一.模块 权限控制的主体单位,与MVC里的Cotroller相对应. 二.模块权限 权限控制的最小单位,通过给每一个模块设置权限,可以控制到非常细小的功能. 三.角色 权限拥有者,通过给不同的角色分配 ...

  5. JavaWeb学习笔记--3.JavaBean

    JavaBean 是一种JAVA语言写成的可重用组件.为写成JavaBean,类必须是具体的和公共的,并且具有无参数的构造器.JavaBean 通过提供符合一致性设计模式的公共方法将内部域暴露成员属性 ...

  6. Content-Disposition的使用方法

    一.作用: 1)希望某类或者某已知MIME类型的文件(比如:*.gif;*txt;*.htm)能够在访问时弹出"文件下载对话框" 2)希望客户端下载时以指定文件名显示 3)希望某文 ...

  7. 深入理解7816(4)---关于T=1

    之前说过的T=0协议,基本上相当于是透明的数据,也就是说从应用的角度看,通过T=0传递的TPDU数据信息大都可以直接转换为对应的APD命令响应数据,“字节”是T=0协议最小的数据传输单元. 对于T=1 ...

  8. android 通过TimePickerDialog修改时间

    初学android,写了个修改时间的小程序,实现如下: 点击change按钮,弹出时间对话框: 然后点击Done,设置显示时间: 实现方式有两种, 一种是使用showDialog方法,不过此种方法已过 ...

  9. JAVA中运用数组的四种排序方法

    JAVA中在运用数组进行排序功能时,一般有四种方法:快速排序法.冒泡法.选择排序法.插入排序法. 快速排序法主要是运用了Arrays中的一个方法Arrays.sort()实现. 冒泡法是运用遍历数组进 ...

  10. Swift字符串常用操作总结

    转自:http://www.jianshu.com/p/52e7580166ff 1.string转换为Int/Long/Float/Double/Bool等 var str1="100&q ...