一次dell R420 电源故障引发的“血案”
说“血案”有写夸张了,其实是也就熬了一夜的通宵,做运维的伤不起啊,作为一名运维工程师,像这种服务器突发故障半夜起床的情况属于家常便饭,见怪不怪了,开始说正事:
前几天半夜12点左右,收到服务器宕机的消息,然后用dell idrac 卡远程,结果无法通过它正常开机,直接发邮件给机房,让他们重置下idrac管理卡(就是拔掉电源线,过2分钟后再插回去),
机房操作好之后,可以连上服务器,结果还没好1分钟,机器又挂了,还是刚才的情况,据我分析应该是哪里硬件出问题了,再通知机房处理,这次机房人员反应,机器无法开机了,当时我有种
不好的预感,可能今晚睡不成了,电话询问了解到服务器插上电源线后,电源会有一些“滴水”的声音发出,怀疑可能电源出问题了,先换了一条电源线,结果依旧,后来找了台同型号闲置的服务器
的电源,打算让机房人员换上看看,结果机房人员不给力,说电源拆不下来,也不敢暴力拆解,我也怕他拆坏,所以只有另想办法,我突然想到能不能把硬盘换到同型号的服务器上,这样应该可以
开启服务器并尽快恢复线上业务,因为服务器是dell 的R420,并且还在报修期内,所以当时就打了dell 官方售后电话:400-886-8618,想让dell 工程师上门维修,不太现实,时间来不及,线上
业务要尽快恢复,所以只能咨询看换硬盘的方案是否可行,得到dell 技术支持的肯定后,就开始换硬盘方案。
这里介绍下,我们两台服务器(为了描述方便,我们记为A,B两台服务器,A为电源故障服务器,B为正常服务器),每台两块硬盘是做的raid1(两块硬盘互为备份),raid 卡 和机器配置都一样,
满足这样的条件,换硬盘的方案才可行,下面说下具体更换步骤:
1、把A机器的两块硬盘拔出,B机器关机,并且电源线也拔掉,然后把A的两块硬盘插入B机器上。
2、把B机器通电,开机,会有一个错误提示说有外部raid 信息,需要导入,按屏幕提示,进入raid 配置工具。
3、在“PD Mgmt”标签中,可以看到两块一样大小,State 都是“Foreign”的硬盘。
4、切换标签到“Foreige View”,查看“Physical Disks”下有两块都是“Online”,但都是“Foreign”的硬盘。
5、然后把光标移到PERC H310 Mini (Bus 1,Dev 0) ,按F2,"Foreign Config" --> "import" ,回车,最后再确认,即可把raid 信息导入成功。(记住确认之后就相当于已经导入了,不需要保存)
附图:



一次dell R420 电源故障引发的“血案”的更多相关文章
- UPS对电源故障的处理能力
		
UPS对电源故障的处理能力 双变换在线式UPS由于其逆变器实时在线工作,因而能对所有的电源故障具有隔离和处理功能.由于目前电网情况发生了很大变化,真正的长时间断电只占所有电源故障的30%甚至更低,而非 ...
 - Dell R420 RAID建立以及系统安装
		
http://thefallenheaven.blog.51cto.com/450907/1753472 Dell R420的RAID划分,以及系统安装 3块2T的盘,装好硬盘后开机,这里有3种方式去 ...
 - 如何在DELL R420上部署EXSI虚拟化(服务器上的安装)
		
<VMware ESXi>是一款虚拟化软件.软件支持windows平台客户端界面管理,客户端界面与正常使用的虚拟机WMware Workstation界面功能类似VMware ESXI 服 ...
 - 一个由正则表达式引发的血案  vs2017使用rdlc实现批量打印  vs2017使用rdlc  [asp.net core 源码分析] 01 - Session  SignalR  sql for xml path用法  MemCahe  C# 操作Excel图形——绘制、读取、隐藏、删除图形   IOC,DIP,DI,IoC容器
		
1. 血案由来 近期我在为Lazada卖家中心做一个自助注册的项目,其中的shop name校验规则较为复杂,要求:1. 英文字母大小写2. 数字3. 越南文4. 一些特殊字符,如“&”,“- ...
 - [WCF]缺少一行代码引发的血案
		
这是今天作项目支持的发现的一个关于WCF的问题,虽然最终我只是添加了一行代码就解决了这个问题,但是整个纠错过程是痛苦的,甚至最终发现这个问题都具有偶然性.具体来说,这是一个关于如何自动为服务接口(契约 ...
 - dubbox微服务实例及引发的“血案”
		
Dubbo 是阿里巴巴公司开源的一个高性能优秀的服务框架,使得应用可通过高性能的 RPC 实现服务的输出和输入功能,可以和 Spring框架无缝集成. 主要核心部件: Remoting: 网络通信框架 ...
 - Integer.parseInt 引发的血案
		
Integer.parseInt 处理一个空字符串, 结果出错了, 程序没有注意到,搞了很久, 引发了血案啊!! 最后,终于 观察到了, 最后的部分: Caused by: java.lang.NoC ...
 - Replication的犄角旮旯(六)-- 一个DDL引发的血案(上)(如何近似估算DDL操作进度)
		
<Replication的犄角旮旯>系列导读 Replication的犄角旮旯(一)--变更订阅端表名的应用场景 Replication的犄角旮旯(二)--寻找订阅端丢失的记录 Repli ...
 - Replication的犄角旮旯(七)-- 一个DDL引发的血案(下)(聊聊logreader的延迟)
		
<Replication的犄角旮旯>系列导读 Replication的犄角旮旯(一)--变更订阅端表名的应用场景 Replication的犄角旮旯(二)--寻找订阅端丢失的记录 Repli ...
 
随机推荐
- codevs 1015 计算器的改良  2000年NOIP全国联赛普及组
			
时间限制: 1 s 空间限制: 128000 KB 题目等级 : 白银 Silver 题目描述 Description NCL是一家专门从事计算器改良与升级的实验室,最近该实验室收到了某公司所委 ...
 - git没有changId解决方法
			
1.git branch work(从最新节点建立分支,相当于将自己的修改备份到新的分支) 2.git reset --hard HEAD~10(强制回滚多个节点) 3.git status 如果显示 ...
 - 从客户端(Content="<EM ><STRONG ><U >这是测试这...")中检测到有潜在危险的Request.Form 值。
			
说明: 请求验证过程检测到有潜在危险的客户端输入值,对请求的处理已经中止.该值可能指示存在危及应用程序安全的尝试,如跨站点脚本攻击.若要允许页面重写应用程序请求验证设置,请将 httpRuntime ...
 - jQuery load()方法用法集锦!
			
调用load方法的完整格式是:DE>load( url, [data], [callback] ),其中DE> DE>urlDE>:是指要导入文件的地址. DE>data ...
 - 发布ASP.NET Core网站到IIS
			
打开VS2015,新建项目: 选择模板,取消身份验证: 项目加载完成后就可以运行了: 下面要发布到IIS: 需要安装从IIS到Kestrel server的反向代理,下载地址:.NET Core Wi ...
 - 基于Spring4+Hibernate4的通用数据访问层+业务逻辑层(Dao层+Service层)设计与实现!
			
基于泛型的依赖注入.当我们的项目中有很多的Model时,相应的Dao(DaoImpl),Service(ServiceImpl)也会增多. 而我们对这些Model的操作很多都是类似的,下面是我举出的一 ...
 - iOS获取本机IP地址
			
#import <ifaddrs.h> #import <arpa/inet.h> // Get IP Address - (NSString *)getIPAddress { ...
 - codevs 2988 保留小数 2
			
2988 保留小数 2 时间限制: 1 s 空间限制: 128000 KB 题目等级 : 白银 Silver 题目描述 Description 这个难度是吸引你点进来的.(其实难度挺 ...
 - 【转】C#  lock的使用
			
一.Lock定义 lock 关键字可以用来确保代码块完成运行,而不会被其他线程中断.它可以把一段代码定义为互斥段(critical section),互斥段在一个时刻内只允许一个线程进入执行, ...
 - UOJ#67. 新年的毒瘤
			
传送门 练习一下Tarjan的模板. 求一下割点,然后加个约束条件判一下特殊点,剩下的就是所求点. //UOJ 67 //by Cydiater //2016.10.27 #include <i ...