POWER 740硬盘更换步骤
把mirror解掉,再从rootvg里面提出来,再用diag确认下,再用命令删掉hdisk1,更换
更换前的准备
1.查看报错日志。
执行errpt列出报错条目
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
A39F8A49 0611123015 T S syserrlg ERROR LOGGING BUFFER OVERFLOW
B6267342 0611123015 P H hdisk0 DISK OPERATION ERROR
A39F8A49 0611123015 T S syserrlg ERROR LOGGING BUFFER OVERFLOW
从上面的输出中找出对应的IDENTIFIER,查看报错详情:errpt
-aj B6267342|more
LABEL: SC_DISK_ERR2
IDENTIFIER: B6267342
Date/Time: Tue Oct 24 09:15:4
9 BEIST 2017
Sequence Number: 1510
Machine Id: 00C89B354C00
Node Id: DCBJLSFX04
Class: H
Type: PERM
Resource Name: hdisk0
Resource Class: disk
Resource Type: scsd
Location: U78A0.001.DNWHKW3-P2-D4
VPD:
Manufacturer................IBM
Machine Type and Model......ST3146356SS
FRU Number..................10N7204
ROS Level and ID............45363046
Serial Number...............3QN2WT58
EC Level....................D76038
Part Number.................10N7203
Device Specific.(Z0)........000005329F001002
Device Specific.(Z1)........0120E60F
Device Specific.(Z2)........0021
Device Specific.(Z3)........09347
Device Specific.(Z4)........
Device Specific.(Z5)........22
Device Specific.(Z6)........D76038
Description
DISK OPERATION ERROR
Probable Causes
DASD DEVICE
Failure Causes
DISK DRIVE
DISK DRIVE ELECTRONICS
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
PATH ID
0
SENSE DATA
0A00 2A00 0751 0B30 0000 4804 0000 0000 0000 0000 0000 0000 0102 0000 7000 0100
0000 0018 0000 0000 5D00 0800 0000 0000 015D 0008 FFFF FFFF FFFF 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 18C2 000B D900 0000 0000 0000 0000 0000 0000 0000 0083 0000
0000 0010 000D
Diagnostic Analysis
Diagnostic Log sequence number: 2049
Resource tested: hdisk0
Resource Description: SAS Disk Drive
Location: U78A0.001.DNWHKW3-P2-D4
SRN: 2556-130
Description: Error log analysis indicates problem reported by disk
drive's self monitoring function.
Possible FRUs:
hdisk0 FRU: 10N7204 U78A0.001.DNWHKW3-P2-D4
SAS Disk Drive
2.查看HDISK0的S/N,P/N号等,在换盘的时候做对照 lscfg
–vl hdisk0 :
hdisk0U78A0.001.DNWHKW3-P2-D4 Other SCSI Disk Drive
Manufacturer................MAXTOR
Machine Type and Model......ATLAS10K5_73SCA
ROS Level and ID............4A4E5A48
Serial Number...............D210K4XK
Device Specific.(Z0)........000003025B00013E
Device Specific.(Z1)........
注意location号U78A0.001.DNWHKW3-P2-D4要与机器对应无误
3.确认原有的状态
显示一个卷组中的所有物理卷信息,名称,状态,和分区情况:lsvg -p rootvg
rootvg:
PV_NAME PV STATE TOTAL PPs FREE PPs FREE DISTRIBUTION
hdisk0 missing 548 503 109..100..75..109..110
hdisk1 active 548 503 109..100..75..109..110
# lsvg -p rootvg
rootvg:
PV_NAME PV STATE TOTAL PPs FREE PPs FREE DISTRIBUTION
hdisk0 active 558 351 111..12..05..111..112
hdisk1 missing 558 351 111..17..00..111..112
# lsvg -p datavg
datavg:
PV_NAME PV STATE TOTAL PPs FREE PPs FREE DISTRIBUTION
hdisk2 active 558 157 112..00..00..00..45
hdisk3 active 558 157 111..00..00..00..46
确认镜像状态 lsvg -l rootvg
rootvg:
LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINT
hd5 boot 1 2 2 closed/stale N/A
hd6 paging 8 16 2 open/syncd N/A
hd8 jfs2log 1 2 2 open/stale N/A
hd4 jfs2 2 4 2 open/stale /
hd2 jfs2 19 38 2 open/stale /usr
hd9var jfs2 5 10 2 open/stale /var
hd3 jfs2 1 2 2 open/stale /tmp
hd1 jfs2 1 2 2 open/stale /home
hd10opt jfs2 4 8 2 open/stale /opt
hd11admin jfs2 1 2 2 open/stale /admin
livedump jfs2 2 4 2 open/stale /var/adm/ras/livedump
注意LPs和PPs一定要为1:2
查看rootvg卷组的详细信息及状态:lsvg rootvg
VOLUME GROUP: rootvg VG IDENTIFIER: 00c57e5f00004c000000015f342b9397
VG STATE: active PP SIZE: 128 megabyte(s)
VG PERMISSION: read/write TOTAL PPs: 1096 (140288 megabytes)
MAX LVs: 256 FREE PPs: 1006 (128768 megabytes)
LVs: 11 USED PPs: 90 (11520 megabytes)
OPEN LVs: 10 QUORUM: 1 (Disabled)
TOTAL PVs: 2 VG DESCRIPTORS: 3
STALE PVs: 1 STALE PPs: 31
ACTIVE PVs: 1 AUTO ON: yes
MAX PPs per VG: 32512
MAX PPs per PV: 1016 MAX PVs: 32
LTG size (Dynamic): 128 kilobyte(s) AUTO SYNC: no
HOT SPARE: no BB POLICY: relocatable
PV RESTRICTION: none INFINITE RETRY: no
注意STALE PVs/PPs数量
4.迁移dump设备
因为原先系统在做镜像时,dump设备不会被镜像,所以现在要确定好dump设备的位置
如果在坏盘hdisk0上,此时应当迁移至hdisk1上。反之,如果在好盘hdisk1上,则无需此迁移步骤。
确认dump设备位置:lspv -l hdisk0,lspv -l hdisk1
hdisk0:
LV NAME LPs PPs DISTRIBUTION MOUNT POINT
hd6 2 4 00..02..00..00..00 N/A
hd8 1 2 00..00..01..00..00 N/A
hd5 1 2 01..00..00..00..00 N/A
hd9var 4 8 00..00..04..00..00 /var
hd3 16 32 00..00..16..00..00 /tmp
hd4 8 16 00..00..08..00..00 /
hd2 16 32 00..00..16..00..00 /usr
hd1 4 8 00..00..04..00..00 /home
hd10opt 11 22 00..00..11..00..00 /opt
livedump 1 2 00..01..00..00..00 /var/adm/ras/livedump
lg_dumplv 4 4 00..04..00..00..00 N/A
hd11admin 1 2 00..00..01..00..00 /admin
在hdisk0上,须做迁移:migratepv -l lg_dumplv hdisk0 hdisk1
确认lg_dumplv已经迁移到hdisk1上:lspv -l hdisk1
把HDISK0从ROOTVG的镜像中移除 unmirrorvg
rootvg hdisk0
0516-1246 rmlvcopy: If hd5 is the boot logical volume, please run 'chpv -c <diskname>'
as root user to clear the boot record and avoid a potential boot
off an old boot image that may reside on the disk from which this
logical volume is moved/removed.
0516-1804 chvg: The quorum change takes effect immediately.
0516-1144 unmirrorvg: rootvg successfully unmirrored, user should perform
bosboot of system to reinitialize boot records. Then, user must modify
bootlist to just include: hdisk1.
查看物理卷状态 lspv rootvg
hdisk0 00c57e5fa8a95af5 rootvg active
hdisk1 00c3f435d0f4916c rootvg active
查看pv上的逻辑卷状态(LPs和PPs的比例为1:1)lspv
-l hdisk1hdisk1:
LV NAME LPs PPs DISTRIBUTION MOUNT POINT
LV NAME LPs PPs DISTRIBUTION MOUNT POINT
hd6 2 2 00..02..00..00..00 N/A
hd8 1 1 00..00..01..00..00 N/A
hd5 1 1 01..00..00..00..00 N/A
hd9var 4 4 00..00..04..00..00 /var
hd3 16 16 00..00..16..00..00 /tmp
hd4 8 8 00..00..08..00..00 /
hd2 16 16 00..00..16..00..00 /usr
hd1 4 4 00..00..04..00..00 /home
hd10opt 11 11 00..00..11..00..00 /opt
livedump 1 1 00..01..00..00..00 /var/adm/ras/livedump
lg_dumplv 4 4 00..04..00..00..00 N/A
hd11admin 1 1 00..00..01..00..00 /admin
这时HDISK0不再和HDISK1为MIRROR ,把hdisk0从rootvg中去除 reducevg
rootvg hdisk0
更换新硬盘
AIX上通过diag判定DISK位置
#diag 执行命令回车
选择黑色部分
用PgDn键翻页找到Hot plug Task回车
选择黑色部分,回车
继续选择黑色部分
选择想判定位置的目标DISK,比如:hdisk0
回车,这个时候去观察硬盘,你会发现硬盘的指示灯会显示"红色",这个硬盘就是你需要判定的目标盘。
如果想把这个有故障的硬盘从SCSI剔除,用F3返回上一级菜单选择"Replace/Remove
a Device Attached to an SCSI Hot Swap Enclosure Device"
光标移到hdisk0处,回车
然后拔掉故障磁盘,插上新的磁盘,执行cfgmgr –v,重新识别出新插的磁盘。
消除系统警告灯
选择黑色部分,回车
用Enter键选择黑色部分,在按F7或者Esc+7键commit
(这里再补充另一种删除硬盘的方法:reducevg后执行rmdev -dl hdisk0 但非常不推荐使用。具体步骤请自行百度)
重做镜像
确认新盘hdisk0是否有PVID:lspv
rootvg
hdisk000c2f65fa4a27df5 none none
hdisk1 00c3f435d0f4916c rootvg active
上面标红的即是。
如果没有,需要手动添加:chdev -l hdisk0 -a pv=yes
HDISK0出现后, 把HDISK0加到ROOTVG中
#extendvg rootvg hdisk0
做MIRROR mirrorvg –S rootvg (也可执行mirrorvg
–c 2 rootvg 等待时间较长)
0516-1804 chvg: The quorum change takes effect immediately.
0516-1126 mirrorvg: rootvg successfully mirrored, user should perform
bosboot of system to initialize boot records. Then, user must modify
bootlist to include: hdisk1 hdisk0.
查看PV lspv
Hdisk0 00x9k241k2l3811n rootvg active
hdisk1 00c3f435d0f4916c rootvg active
在HDISK0上创建boot image
bosboot –ad hdisk0
bosboot: Boot image is 51228 512 byte blocks
先确认当前启动顺序bootlist –m normal -o
改变启动设备的顺序 bootlist –m normal hdisk0 hdisk1 cd0
确认修改后的启动顺序bootlist –m normal -o
后续操作:在HMC上关闭事件,系统中执行errclear 0清空相关报错。
POWER 740硬盘更换步骤的更多相关文章
- DS4700电池更换步骤
DS4700电池更换步骤: 在A控制器里操作(带电热插拔控制器)对逻辑盘进行切换: (需要先将A控下挂的硬盘手工切换到B控上.然后对A控进行电池更换,更换完成后再将原A控下挂硬盘切回) 如下详细步骤: ...
- 分布式存储ceph——(5)ceph osd故障硬盘更换
正常状态:
- Ceph添加、删除osd及故障硬盘更换
添加或删除osd均在ceph部署节点的cent用户下的ceph目录进行. 1. 添加osd 当前ceph集群中有如下osd,现在准备新添加osd: (1)选择一个osd节点,添加好新的硬盘: (2)显 ...
- 分布式存储ceph--osd故障硬盘更换(6)
正常状态:
- Ceph osd故障硬盘更换
正常状态: 故障状态: 实施更换步骤: (1)关闭ceph集群数据迁移: osd硬盘故障,状态变为down.在经过mod osd down out interval 设定的时间间隔后,ceph将其标记 ...
- 分布式存储ceph---ceph osd 故障硬盘更换(6)
正常状态: 故障状态: 实施更换步骤: 1.关闭ceph集群数据迁移: osd硬盘故障,状态变为down.在经过mod osd down out interval 设定的时间间隔后,ceph将其标记为 ...
- UNIX故障--sun m4000服务器故障硬盘更换案例
一.故障诊断 查看messages日志c0d0t0这块盘不断报错,类型为:retryable,如下: root@gdhx # more /var/adm/messages Aug 5 16:43:0 ...
- Oracle VM VirtualBox虚拟机内Linux系统硬盘扩容步骤(CentOS6.5)
1.首先获取要扩容的虚拟机的 UUID VBoxManage 改命令在C:\Program Files\Oracle\VirtualBox目录内,可先添加该目录到环境变量.C:\Users\yzkj- ...
- win7系统查看硬盘序列号步骤
1.在开始那里输入cmd,打开命令窗口: 2.输入diskpart,按enter键,进入底盘查看选项: 3.输入list disk,按回车键: list disk:查看电脑上有几块硬盘: 输入sele ...
随机推荐
- MySQL 快速删除大量数据
千万级数据量 方案1. 直接使用delete 因delete执行速度与索引量成正比,若表中索引量较多,使用delete会耗费数小时甚至数天的时间 方案2. (1)创建临时表,表结构与原表结构相同 ...
- Go语言 - 包(package)
在工程化的Go语言开发项目中,Go语言的源码复用是建立在包(package)基础之上的.本文介绍了Go语言中如何定义包.如何导出包的内容及如何导入其他包. Go语言的包(package) 包介绍 包( ...
- 树形DP入门题目推荐以及解析
关于树形DP几道入门题目 今天恶补树形DP,感觉海星. 其实挺简单的. 介绍几道例题,我会的. 1.洛谷P1352 没有上司的舞会 我的一篇题解 我们可以考虑每一个节点都是有两种情况. 一个是被邀请: ...
- HNOI做题记录
算是--咕完了? 2013.2014的就咕了吧,年代太久远了,并且要做的题还有那么多-- LOJ #2112. 「HNOI2015」亚瑟王 发现打出的概率只和被经过几次有关. 于是\(dp_{i,j} ...
- markdown转html
今天临时要写接口文档,然后发现部门给的文档是markdown文件的,而接口文档是要html格式的,因此想直接把markdown转为html 这里我使用的是marked 首先初始化一个node项目 np ...
- 模拟25A 题解
A. Lighthouse m的范围极小,显然的容斥. 总的方案数,减去受任意一个限制的方案数,加回受两个限制的方案数. 就能得到受所有限制的的方案数. 将选择的一些边所指向的点放在同一个联通块里. ...
- 5G 融合计费系统架构设计与实现(一)
5G 融合计费系统架构设计与实现(一) 随着5G商用临近,5G的各个子系统也在加紧研发调试,本人有兴全程参与5G中的融合计费系统(CCS)的设计.开发.联调工作.接下来将用几篇文章介绍我们在CCS实现 ...
- linux 上使用yum 安装openjdk1.8
使用yum查找jdk: yum search java|grep jdk # yum search java|grep jdk ldapjdk-javadoc.noarch : Javadoc for ...
- JPA的一对多,多对多用法
一.@OneToOne关系映射 JPA使用@OneToOne来标注一对一的关系. 实体 People :用户. 实体 Address:家庭住址. People 和 Address 是一对一的关系. 这 ...
- 配置Zuul代理下游的认证
配置Zuul代理下游的认证 您可以通过proxy.auth.*设置控制@EnableZuulProxy下游的授权行为.例: application.yml proxy: auth: routes: c ...