服务器型号:ThinkServer RD650
操作系统:Red Hat 6.7
业务用途:生产环境监控机

接到机房邮件通知,告知某台服务器硬盘告警,并提供了设备SN号和机柜位置。根据提供想相关信息找到对应的设备IP并确定该设备的业务用途。

登录到该设备确认SN号是否对应:

#dmidecode | egrep -A10 -i 'system infor'
System Information
Manufacturer: LENOVO
Product Name: ThinkServer RD650
Version: XXXXX
Serial Number:xxxxx # S/N号
UUID: xxxxx
Wake-up Type: Power Switch
SKU Number: LENOVO_MT_ND
Family: ThinkServer Handle 0x0002, DMI type 2, 15 bytes

S/N号确认是该服务器,该服务器是一台监控机,确保业务没有受到影响。通过 MegaCli64 命令查看物理磁盘状况

#./MegaCli64 -PDList -aALL |grep "Firmware state"
Firmware state: Online, Spun Up
Firmware state: Online, Spun Up
Firmware state: Offline
Firmware state: Online, Spun Up

发现第三块磁盘已经处于 Offline 的状态,需要尽快处理,再次检查 raid 级别:

#./MegaCli64 -LDInfo -Lall -aALL 

Adapter 0 -- Virtual Drive Information:
Virtual Drive: 0 (Target Id: 0)
Name :1
RAID Level : Primary-1, Secondary-0, RAID Level Qualifier-0 # RAID 1
Size : 3.635 TB
Mirror Data : 3.635 TB
State : Degraded
Strip Size : 64 KB
Number Of Drives per span:2
Span Depth : 2
Default Cache Policy: WriteThrough, ReadAhead, Direct, No Write Cache if Bad BBU
Current Cache Policy: WriteThrough, ReadAhead, Direct, No Write Cache if Bad BBU
Default Access Policy: Read/Write
Current Access Policy: Read/Write
Disk Cache Policy : Disabled
Encryption Type : None
Is VD Cached: No Exit Code: 0x00

通过查看得知,4块盘做到 RAID 1, 虽说是监控机,但是4块盘组 RAID 10 还是更好。

去到机房,换上备用的同型号容量的硬盘,在使用 MegaCli64  命令查看磁盘状态:

#./MegaCli64 -PDList -aALL |grep "Firmware state"
Firmware state: Online, Spun Up
Firmware state: Online, Spun Up
Firmware state: Rebuild
Firmware state: Online, Spun Up

确认磁盘已经读到,并 RAID组在重建。过上一段时间。再次查看重建的进度:

#./MegaCli64 -PDRbld -ProgDsply -PhysDrv [:2] -a0
说明: [:2] 磁盘从0开始,第三块磁盘的索引是 2 。

动态可视化的重建进度如下图:

位置索引为2的磁盘重建进度已经 99% 已耗时 5小时9分钟,重建完成后,再次检查物理磁盘的状态:

#./MegaCli64 -PDList -aALL |grep "Firmware state"
Firmware state: Online, Spun Up
Firmware state: Online, Spun Up
Firmware state: Online, Spun Up
Firmware state: Online, Spun Up

所有磁盘都已经 Online 状态,本次更换磁盘完毕,数据没有受到任何的影响。

质疑一:
    在 RAID 重建的时候,数据无法写入到逻辑盘?
    答:经过真实环境测试,RAID 在重建的时候,并不会影响数据的写入操作。

此次是针对该服务器是监控机,数据并不重要的前提下,直接进行的热插拔更换物理磁盘,重建 RAID 组,在业务服务器上,还请备份,备份,再备份进行磁盘的更换的操作,不要过分相信冗余和灾备,一旦发生不可控事件,数据可能就无法恢复了,请慎重!

关于 MegaCli64 命令的使用,请参考:

      http://www.ttlsa.com/tools/megacli-monitor-raid-status/

[ Linux ] 服务器更换硬盘的更多相关文章

  1. Linux服务器更换主板后,网卡识别失败的处理方法

    1)现象说明公司IDC机房里的一台线上服务器硬件报警,最后排查发现服务器主板坏了,随即联系厂商进行更换主板,最后更换后,登录服务器,发现网卡绑定及ip信息都在,但是ip却ping不通了,进一步排查,重 ...

  2. 全面了解 Linux 服务器 - 3. 查看 Linux 服务器的硬盘使用情况

    1)查看硬盘及分区信息 liuqian@ubuntu:~# fdisk -l ...... ...... Disk /dev/sda: 100 GiB, 107374182400 bytes, 209 ...

  3. linux服务器加硬盘扩容

    from: http://bbs.chinaunix.net/thread-3613556-1-1.html 试验环境: vmware下,centos6,64位版本,原来系统默认分区,/dev/sda ...

  4. 阿里云Linux服务器挂载硬盘分区

    查看所有硬盘与分区 fdisk -l 运行命令 fdisk /dev/xvdb 根据提示,依次输入 n p 1    (数字一 不是 L) 回车 回车 w 提示 Syncing disks.时,表示已 ...

  5. DELLR720服务器更换硬盘,启动系统报错:there are offline or missing virtual drivers with preserved cache

    linux系统启动过程中给出错误: There are offline or missing virtual drives with preserved cache. Please check the ...

  6. CentOS Linux服务器 挂载硬盘

    1.通过fdisk -l 查看目前的硬盘信息,默认是从sda开始排,增加第二块硬盘的时候,会显示sdb,以此类推,我的是vda,vdb,以自己实际的为主,下面以sda,sdb 讲解 2.添加硬盘3.重 ...

  7. hadoop更换硬盘

    hadoop服务器更换硬盘操作步骤(datanode hadoop目录${HADOOP_HOME}/bin    日志位置:/var/log/hadoop)1.登陆服务器,切换到mapred用户,执行 ...

  8. linux阿里云服务器更换镜像的方法

    linux阿里云服务器更换镜像的方法 1 先进入硬盘创建快照 生成自定义镜像 ps:他可以在阿里云各个服务器上共享 再左侧镜像 点击去可以看到共享 直接进ecs 关闭服务器 重新初始化硬盘 然后主界面 ...

  9. 在linux服务器新添加硬盘,如何识别、挂载。

    在linux服务器新添加硬盘,如何识别.怎样挂载磁盘.过程是怎么样. fdisk - manipulate disk partition tablemkfs - build a Linux files ...

随机推荐

  1. [SCOI2008]天平 差分约束

    ---题面--- 题解: 差分约束学得实在是太烂了,,,,QAQ 这里先记下: a - b >= x  ---> a >= b + x     ---->        b - ...

  2. BZOJ4552:[HEOI2016/TJOI2016]排序——题解

    https://www.lydsy.com/JudgeOnline/problem.php?id=4552 https://www.luogu.org/problemnew/show/P2824 在2 ...

  3. HDU3157:Crazy Circuits——题解

    http://acm.hdu.edu.cn/showproblem.php?pid=3157 题目大意:给一个电路 ,起点为+,终点为-,包括起点终点在内的电元件之间有有下界边,求最小流. ————— ...

  4. 洛谷 P3242 [HNOI2015]接水果 解题报告

    P3242 [HNOI2015]接水果 题目描述 风见幽香非常喜欢玩一个叫做 \(osu!\) 的游戏,其中她最喜欢玩的模式就是接水果.由于她已经\(DT\) \(FC\) 了\(\tt{The\ b ...

  5. 洛谷 P4555 [国家集训队]最长双回文串 解题报告

    P4555 [国家集训队]最长双回文串 题目描述 顺序和逆序读起来完全一样的串叫做回文串.比如acbca是回文串,而abc不是(abc的顺序为abc,逆序为cba,不相同). 输入长度为\(n\)的串 ...

  6. Flex 布局教程:语法篇 【转】

    Flex 布局教程:语法篇   作者: 阮一峰 日期: 2015年7月10日 原文:http://www.ruanyifeng.com/blog/2015/07/flex-grammar.html 网 ...

  7. 关于web.xml中的<welcome-file-list>中的默认首页资料

    关于web.xml中的<welcome-file-list>中的默认首页文件 先看我的配置文件: <welcome-file-list> <welcome-file> ...

  8. Codeforces Round #343 (Div. 2) B

    B. Far Relative’s Problem time limit per test 2 seconds memory limit per test 256 megabytes input st ...

  9. Japan POJ - 3067 转化思维 转化为求逆序对

    Japan plans to welcome the ACM ICPC World Finals and a lot of roads must be built for the venue. Jap ...

  10. springcloud文章推荐

    有幸加入到springcloud中国社区,在这里获取到了不一样的技术,也接触到了不少的大牛! 这篇文章对于springcloud能否在企业中应用或者对springcloud想了解的人个人感觉写的非常好 ...