一次dell R420 电源故障引发的“血案”
说“血案”有写夸张了,其实是也就熬了一夜的通宵,做运维的伤不起啊,作为一名运维工程师,像这种服务器突发故障半夜起床的情况属于家常便饭,见怪不怪了,开始说正事:
前几天半夜12点左右,收到服务器宕机的消息,然后用dell idrac 卡远程,结果无法通过它正常开机,直接发邮件给机房,让他们重置下idrac管理卡(就是拔掉电源线,过2分钟后再插回去),
机房操作好之后,可以连上服务器,结果还没好1分钟,机器又挂了,还是刚才的情况,据我分析应该是哪里硬件出问题了,再通知机房处理,这次机房人员反应,机器无法开机了,当时我有种
不好的预感,可能今晚睡不成了,电话询问了解到服务器插上电源线后,电源会有一些“滴水”的声音发出,怀疑可能电源出问题了,先换了一条电源线,结果依旧,后来找了台同型号闲置的服务器
的电源,打算让机房人员换上看看,结果机房人员不给力,说电源拆不下来,也不敢暴力拆解,我也怕他拆坏,所以只有另想办法,我突然想到能不能把硬盘换到同型号的服务器上,这样应该可以
开启服务器并尽快恢复线上业务,因为服务器是dell 的R420,并且还在报修期内,所以当时就打了dell 官方售后电话:400-886-8618,想让dell 工程师上门维修,不太现实,时间来不及,线上
业务要尽快恢复,所以只能咨询看换硬盘的方案是否可行,得到dell 技术支持的肯定后,就开始换硬盘方案。
这里介绍下,我们两台服务器(为了描述方便,我们记为A,B两台服务器,A为电源故障服务器,B为正常服务器),每台两块硬盘是做的raid1(两块硬盘互为备份),raid 卡 和机器配置都一样,
满足这样的条件,换硬盘的方案才可行,下面说下具体更换步骤:
1、把A机器的两块硬盘拔出,B机器关机,并且电源线也拔掉,然后把A的两块硬盘插入B机器上。
2、把B机器通电,开机,会有一个错误提示说有外部raid 信息,需要导入,按屏幕提示,进入raid 配置工具。
3、在“PD Mgmt”标签中,可以看到两块一样大小,State 都是“Foreign”的硬盘。
4、切换标签到“Foreige View”,查看“Physical Disks”下有两块都是“Online”,但都是“Foreign”的硬盘。
5、然后把光标移到PERC H310 Mini (Bus 1,Dev 0) ,按F2,"Foreign Config" --> "import" ,回车,最后再确认,即可把raid 信息导入成功。(记住确认之后就相当于已经导入了,不需要保存)
附图:



一次dell R420 电源故障引发的“血案”的更多相关文章
- UPS对电源故障的处理能力
UPS对电源故障的处理能力 双变换在线式UPS由于其逆变器实时在线工作,因而能对所有的电源故障具有隔离和处理功能.由于目前电网情况发生了很大变化,真正的长时间断电只占所有电源故障的30%甚至更低,而非 ...
- Dell R420 RAID建立以及系统安装
http://thefallenheaven.blog.51cto.com/450907/1753472 Dell R420的RAID划分,以及系统安装 3块2T的盘,装好硬盘后开机,这里有3种方式去 ...
- 如何在DELL R420上部署EXSI虚拟化(服务器上的安装)
<VMware ESXi>是一款虚拟化软件.软件支持windows平台客户端界面管理,客户端界面与正常使用的虚拟机WMware Workstation界面功能类似VMware ESXI 服 ...
- 一个由正则表达式引发的血案 vs2017使用rdlc实现批量打印 vs2017使用rdlc [asp.net core 源码分析] 01 - Session SignalR sql for xml path用法 MemCahe C# 操作Excel图形——绘制、读取、隐藏、删除图形 IOC,DIP,DI,IoC容器
1. 血案由来 近期我在为Lazada卖家中心做一个自助注册的项目,其中的shop name校验规则较为复杂,要求:1. 英文字母大小写2. 数字3. 越南文4. 一些特殊字符,如“&”,“- ...
- [WCF]缺少一行代码引发的血案
这是今天作项目支持的发现的一个关于WCF的问题,虽然最终我只是添加了一行代码就解决了这个问题,但是整个纠错过程是痛苦的,甚至最终发现这个问题都具有偶然性.具体来说,这是一个关于如何自动为服务接口(契约 ...
- dubbox微服务实例及引发的“血案”
Dubbo 是阿里巴巴公司开源的一个高性能优秀的服务框架,使得应用可通过高性能的 RPC 实现服务的输出和输入功能,可以和 Spring框架无缝集成. 主要核心部件: Remoting: 网络通信框架 ...
- Integer.parseInt 引发的血案
Integer.parseInt 处理一个空字符串, 结果出错了, 程序没有注意到,搞了很久, 引发了血案啊!! 最后,终于 观察到了, 最后的部分: Caused by: java.lang.NoC ...
- Replication的犄角旮旯(六)-- 一个DDL引发的血案(上)(如何近似估算DDL操作进度)
<Replication的犄角旮旯>系列导读 Replication的犄角旮旯(一)--变更订阅端表名的应用场景 Replication的犄角旮旯(二)--寻找订阅端丢失的记录 Repli ...
- Replication的犄角旮旯(七)-- 一个DDL引发的血案(下)(聊聊logreader的延迟)
<Replication的犄角旮旯>系列导读 Replication的犄角旮旯(一)--变更订阅端表名的应用场景 Replication的犄角旮旯(二)--寻找订阅端丢失的记录 Repli ...
随机推荐
- PAT 1036. 跟奥巴马一起编程(15)
美国总统奥巴马不仅呼吁所有人都学习编程,甚至以身作则编写代码,成为美国历史上首位编写计算机代码的总统.2014年底,为庆祝"计算机科学教育周"正式启动,奥巴马编写了很简单的计算机代 ...
- Netron源码解读(一):GraphControl画布对象
GraphControl是Netron中比较重要的一个类,属于所有图形作图的画布.它管理着画布上的所有图形对象的移动.变形.连接.拖放.这些功能很重要的一部分是通过对鼠标事件的处理实现的.下面我们就看 ...
- iOS面试
1.进程.线程的区别?2.“三次握手”是什么?具体细节,连接释放时需要几次“握手”,说出大概过程.3.TCP.UDP协议的区别?计算机网络分几层,以及TCP.Http协议各自工作在哪一层及相关细节.4 ...
- Swift来的正是时候
早期对ObjectiveC这玩意不是很感冒,一直没有动手搞Apple平台下的开发,现在Swift来了,时机成熟,提升门槛后的IOS,才是量子本人想弄的.现在不用担心搞ObjectiveC的走在前面了. ...
- RapidJSON v1.1.0 发布简介
时隔 15.6 个月,终于发布了一个新版本 v1.1.0. 新版本除了包含了这些日子收集到的无数的小改进及 bug fixes,也有一些新功能.本文尝试从使用者的角度,简单介绍一下这些功能和沿由. P ...
- 【USACO 2.4】The Tamworth Two
题意:C代表cows,F代表farmer,一开始都向北,每分钟前进1步,如果前方不能走,则这分钟顺时针转90°,问多少步能相遇,或者是否不可能相遇,10*10的地图. 题解:dfs,记录状态,C和F的 ...
- 经典KMP算法C++与Java实现代码
前言: KMP算法是一种字符串匹配算法,由Knuth,Morris和Pratt同时发现(简称KMP算法).KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的.比 ...
- BZOJ 1086: [SCOI2005]王室联邦
1086: [SCOI2005]王室联邦 Time Limit: 10 Sec Memory Limit: 162 MBSec Special JudgeSubmit: 1399 Solved: ...
- transform
{ transform: scale3d(x,y,z) /*放大*/ translate3d(x,y,z) /*位置*/ rotate3d(x,y,z,angle) /*旋转*/ skew(x-ang ...
- nginx中将POST数据写到日志里面的正确方式
http://www.cnblogs.com/meteorx/p/3188647.html