UNIX故障--sun m4000服务器故障硬盘更换案例
一、故障诊断
查看messages日志c0d0t0这块盘不断报错,类型为:retryable,如下:
root@gdhx # more /var/adm/messages
Aug 5 16:43:03 gdhx scsi: [ID 107833 kern.warning] WARNING: /pci@0,600000/pci@0/pci@8/pci@0/scsi@1/sd@1,0 (sd0):
Aug 5 16:43:03 gdhx Error for Command: write(10) Error Level: Retryable
Aug 5 16:43:03 gdhx scsi: [ID 107833 kern.notice] Requested Block: 30334832 Error Block: 30334848
Aug 5 16:43:03 gdhx scsi: [ID 107833 kern.notice] Vendor: FUJITSU Serial Number: 0816H01WMN
Aug 5 16:43:03 gdhx scsi: [ID 107833 kern.notice] Sense Key: Hardware Error
Aug 5 16:43:03 gdhx scsi: [ID 107833 kern.notice] ASC: 0x44 (<vendor unique code 0x44>), ASCQ: 0xa3, FRU: 0x0
Iostat -En查看硬盘hard errors:20,处于增长趋势
综上结论:需更换c0d0t0硬盘,可在线更换硬盘。
二、故障处理过程
1、svm信息
root@gdhx # metastat
d4: 镜像
次镜像 0: d14
状态: 确定
次镜像 1: d24
状态: 确定
传送: 1
读入选项: roundrobin (缺省)
写入选项: parallel (缺省)
大小: 167781888 块 (80 GB)
d14: d4 的次镜像
状态: 确定
大小: 167781888 块 (80 GB)
条 0:
设备 引导块 Dbase 状态 Reloc 热备援
c0t0d0s4 0 否 确定 是
d24: d4 的次镜像
状态: 确定
大小: 167781888 块 (80 GB)
条 0:
设备 引导块 Dbase 状态 Reloc 热备援
c0t1d0s4 0 否 确定 是
d1: 镜像
次镜像 0: d11
状态: 确定
次镜像 1: d21
状态: 确定
传送: 1
读入选项: roundrobin (缺省)
写入选项: parallel (缺省)
大小: 16790400 块 (8.0 GB)
d11: d1 的次镜像
状态: 确定
大小: 16790400 块 (8.0 GB)
条 0:
设备 引导块 Dbase 状态 Reloc 热备援
c0t0d0s1 0 否 确定 是
d21: d1 的次镜像
状态: 确定
大小: 16790400 块 (8.0 GB)
条 0:
设备 引导块 Dbase 状态 Reloc 热备援
c0t1d0s1 0 否 确定 是
d0: 镜像
次镜像 0: d10
状态: 确定
次镜像 1: d20
状态: 确定
传送: 1
读入选项: roundrobin (缺省)
写入选项: parallel (缺省)
大小: 100355712 块 (47 GB)
d10: d0 的次镜像
状态: 确定
大小: 100355712 块 (47 GB)
条 0:
设备 引导块 Dbase 状态 Reloc 热备援
c0t0d0s0 0 否 确定 是
d20: d0 的次镜像
状态: 确定
大小: 100355712 块 (47 GB)
条 0:
设备 引导块 Dbase 状态 Reloc 热备援
c0t1d0s0 0 否 确定 是
Device Relocation Information:
Device Reloc Device ID
c0t1d0 是 id1,sd@n500000e01aff7320
c0t0d0 是 id1,sd@n5000c5001782f5b3
root@gdhx # df -k
文件系统 千字节 用了 可用 容量 挂接在
/dev/md/dsk/d0 49418200 33780228 15143790 70% /
/devices 0 0 0 0% /devices
ctfs 0 0 0 0% /system/contract
proc 0 0 0 0% /proc
mnttab 0 0 0 0% /etc/mnttab
swap 2203656 1720 2201936 1% /etc/svc/volatile
objfs 0 0 0 0% /system/object
sharefs 0 0 0 0% /etc/dfs/sharetab
fd 0 0 0 0% /dev/fd
swap 2203256 1320 2201936 1% /tmp
swap 2201984 48 2201936 1% /var/run
/dev/md/dsk/d4 82620893 59432265 22362420 73% /bea
root@gdhx # metadb
flags first blk block count
a m p luo 16 8192 /dev/dsk/c0t0d0s7
a p luo 8208 8192 /dev/dsk/c0t0d0s7
a p luo 16400 8192 /dev/dsk/c0t0d0s7
a p luo 16 8192 /dev/dsk/c0t1d0s7
a p luo 8208 8192 /dev/dsk/c0t1d0s7
root@gdhx # metastat -p
d4 -m d14 d24 1
d14 1 1 c0t0d0s4
d24 1 1 c0t1d0s4
d1 -m d11 d21 1
d11 1 1 c0t0d0s1
d21 1 1 c0t1d0s1
d0 -m d10 d20 1
d10 1 1 c0t0d0s0
d20 1 1 c0t1d0s0
2、删除报错硬盘的分区镜像
metadetach -f d0 d20
metadetach -f d1 d21
metadetach -f d4 d24
metaclear d20
metaclear d21
metaclear d24
3、删除报错硬盘的状态数据库
metadb -d /dev/dsk/c0t1d0s7
4、物理更换硬盘(确定硬盘亮蓝灯才更换),format确认硬盘正常被识别
5、复制分区
prtvtoc /dev/rdsk/c0t0d0s2 | fmthard -s - /dev/rdsk/c0t1d0s2
6、创建新盘状态数据库
metadb -a -f -c 2 c0t1d0s7
7、创建镜像
metainit d20 1 1 c0t1d0s0
metainit d21 1 1 c0t1d0s1
metainit d24 1 1 c0t1d0s4
metattach d0 d20
metattach d1 d21
metattach d4 d24
8、查看镜像数据同步进度
metastat |grep %
三、检查设备
查看硬盘状态、日志等信息
Format
Iostat -En
messages
UNIX故障--sun m4000服务器故障硬盘更换案例的更多相关文章
- 分布式存储ceph——(5)ceph osd故障硬盘更换
正常状态:
- Ceph添加、删除osd及故障硬盘更换
添加或删除osd均在ceph部署节点的cent用户下的ceph目录进行. 1. 添加osd 当前ceph集群中有如下osd,现在准备新添加osd: (1)选择一个osd节点,添加好新的硬盘: (2)显 ...
- 分布式存储ceph--osd故障硬盘更换(6)
正常状态:
- Ceph osd故障硬盘更换
正常状态: 故障状态: 实施更换步骤: (1)关闭ceph集群数据迁移: osd硬盘故障,状态变为down.在经过mod osd down out interval 设定的时间间隔后,ceph将其标记 ...
- 分布式存储ceph---ceph osd 故障硬盘更换(6)
正常状态: 故障状态: 实施更换步骤: 1.关闭ceph集群数据迁移: osd硬盘故障,状态变为down.在经过mod osd down out interval 设定的时间间隔后,ceph将其标记为 ...
- 部署AlwaysOn第一步:搭建Windows服务器故障转移集群
在Windows Server 2012 R2 DataCenter 环境中搭建集群之前,首先要对Windows服务器故障转移集群(Windows Server Failover Cluster,简称 ...
- 全国出现大面积DNS服务器故障 域名被劫持
1月21日消息,继今日上午腾讯16项服务出现故障后,大量网站出现了无法访问的情况,据了解,该故障是由于国内DNS根服务器故障所致. 据了解,此次攻击式由于国内所有通用顶级域的根服务器出现异常,导致大量 ...
- 虚IP解决程序连只读服务器故障漂移
目前公司有一套核心交易数据库配置了AlWaysON,SQL 2012版本, 1主4从, 其从库(8,14, 8.15) 这2台只读的从数据库服务器, 后台程序和wms等很多程序,都是直接配置IP连接这 ...
- Apache服务器故障排除攻略
Apache服务器故障排除攻略 应用服务器Apache浏览器配置管理网络应用 随着网络技术的普及.应用和Web技术的不断完善,Web服务已经成为互联网上重要的服务形式之一.原有的客户端/服务器模式正 ...
随机推荐
- AutoHotkey调用VBA实现批量精确筛选数据透视表某字段内容。
如上图,想在数据透视表中只显示红色区域的内容,手动勾选就比较繁琐. 实现思路: 先复制红色的内容. 鼠标停留在数据透视表[型号]列的任意数据上(通过该单元格可以获取数据透视表和字段) 由于数据透视表的 ...
- hosts配置
转自:http://www.cnblogs.com/ylemzhang/archive/2011/10/19/2217187.htm 注意: hosts文件不支持端口映射 如果指定端口参考: //直 ...
- PHP 字符串补0
转自:https://www.cnblogs.com/bluebirds/archive/2016/11/22/6091099.html#undefined 概述:项目中经常会使用到在一串编码左边.右 ...
- (转)tcp的半连接与完全连接队列
队列及参数 tcp-sync-queue-and-accept-queue-small.jpg server端的半连接队列(syn队列) 在三次握手协议中,服务器维护一个半连接队列,该队列为每个客 ...
- spring mvc(4)处理模型数据
处理模型数据 Spring MVC 提供了以下几种途径输出模型数据: – ModelAndView: 处理方法返回值类型为 ModelAndView时, 方法体即可通过该对象添加 模型数据 – Map ...
- stixel上边缘
上图是2^x-1的曲线,取值范围在(-1,正无穷) 上面两个公式组成了隶属函数(membership)表示隶属度,隶属度就是衡量这个点同下边缘点是否属于同一个物体.实际上M函数就是2^x-1,但M函数 ...
- windows下如何安装pip以及如何查看pip是否已经安装成功?
最近刚学习python,发现很多关于安装以及查看pip是否安装成的例子都比较老,不太适合于现在(python 3.6 )因此,下一个入门级别的教程. 0:首先如何安装python我就不做介绍了. 1: ...
- 掺合模式(Mixin)
Mixin是JavaScript中用的最普遍的模式,可以就任意一个对象的全部或部分属性拷贝到另一个对象上.从提供的接口来看,有的是对对象的操作,有的是对类的操作.对类的操作又称为掺元类(Mixin c ...
- hdu 1520 Anniversary party(第一道树形dp)
传送门: http://acm.hdu.edu.cn/showproblem.php?pid=1520 Anniversary party Time Limit: 2000/1000 MS (Java ...
- Extjs header column 自定义排序规则
Extjs 的表格自带排序功能,这个功能在大部分情况下能够满足我们的需求,但是在某种情况下,例如IP排序,默认情况下,按照字符串进行排序, 此时我们需要自定义排序规则,这个时候就需要我们重写方法了, ...