【服务器数据恢复】VSAN节点容量盘故障离线的数据恢复案例
VSAN简介:
VSAN是以vSphere内核为基础开发,可以扩展使用的分布式存储架构。该架构在vSphere集群主机中安硬盘及闪存构建VSAN存储层,通过存储进行管理与控制,最终形成一个共享存储层。
VSAN数据存储是一个对象存储,以文件系统的形式呈现给vSphere主机。这个对象存储服务会从VSAN集群中的每台主机上加载卷,然后展现为单一的、在所有节点上可见的分布式共享数据存储。
VSAN简化了存储配置,对于虚拟机来说就只有一个数据存储。这个分布式数据存储来自VSAN集群中每台vSphere主机上的存储空间,通过磁盘组进行配置,在单独的存储实体中存储所有的虚拟机文件。如果闪存盘或者容量盘出现故障的时候,数据会向其他节点转移,虽然这种存储方式相对安全,但是在转移的过程中也有可能出现其他故障。
服务器数据恢复环境:
四台服务器节点组成的VSAN集群;
每台服务器节点上有两个磁盘组;每个磁盘组由一块SSD硬盘+5块SAS硬盘组成,SSD做闪存,SAS做容量盘。
服务器故障:
其中一个服务器节点上的一个磁盘组中的容量盘出现故障离线,这个时候VSAN开始数据重构&迁移,在迁移还没有完成的时候机房停电。来电重启设备后发现该服务器节点上另外一个磁盘组中有两块容量盘故障离线,数据存储出现故障。虽然可以登陆VSAN管理控制台,但是所有的虚拟机都无法访问了。
服务器数据恢复过程:
1、把四个服务器节点的所有硬盘以只读方式做镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始数据造成二次破坏。
2、基于镜像文件分析底层数据的存储结构,确认虚拟机所在硬盘的分布信息。北亚企安数据恢复工程师根据分析出来的数据存储结构开发相应的程序来测试数据分布信息的准确性。
3、单独分析每个服务器节点上的两个磁盘组,搞清楚磁盘组内的闪存盘和容量盘之间的对应关系,每块硬盘都有一个唯一标识进行磁盘间的对应。
a、获取每块磁盘的UUID和磁盘组的UUID
b、获取每个磁盘组中的容量盘的组件信息。
c、根据容量盘的组件信息中记录的组件的MAP位置提取组件位图。
d、根据组件位图提取组件数据和缓存数据。
e、根据组件的描述信息获取组件所属对象和组件顺序,把组件合并成对象。
f、根据对象提取数据。
可以将对象看成一个卷,也可以把对象看做一个逻辑卷,每个数据存储上的VSAN对象都是由多个组件构成,这些组件分布于集群主机上配置的磁盘组中。在恢复VSAN数据过程中,组件信息的提取是关键。本案例故障组件损坏比较少,恢复出来的虚拟机都能正常启动。
【服务器数据恢复】VSAN节点容量盘故障离线的数据恢复案例的更多相关文章
- Redis07-Redis单节点容量问题,twemproxy,predixy的使用
		Redis单节点容量问题 一.单节点容量问题 我们在实际场景中,往往遇上一个单节点容量问题. 1.进行业务拆分,数据分类 2.到了数据不能拆分的时候,可以进行数据分片 进行哈希取模(影响分布式下的扩展 ... 
- ubuntu服务器 安装 seafile 个人网盘
		目录 ubuntu服务器 安装 seafile 个人网盘 一.实验环境: 二.实验流程介绍 三.网盘搭建 1.安装依赖环境 2.安装seafile 三.配置QQ域名邮箱 四.配置seafile邮件服务 ... 
- UVALive-3972 March of the Penguins (最大流:节点容量)
		题目大意:有n个带有裂缝的冰块.已知每个冰块的坐标和已经站在上面的企鹅数目,每当一个企鹅从一个冰块a跳到另一个冰块b上的时候,冰块a上的裂缝便增大一点,还知道每个冰块上最多能被跳跃的次数.所有的企鹅都 ... 
- Mongodb 5节点异地两中心故障转移恢复测试案例
		Mongodb5节点异地两中心故障转移恢复测试案例 架构方式:5节点,主中心(2数据1仲裁),备中心(1数据1仲裁) 1基本情况 操作系统:Red Hat Enterprise Linux Serve ... 
- 【故障公告】数据库服务器 CPU 近 100% 引发的故障
		抱歉,今天上午 10:48 ~ 10:33 期间,我们所使用的数据库服务(阿里云 RDS 实例 SQL Server 2016 标准版)又出现了 CPU 近 100% 问题,由此给您带来麻烦,请您谅解 ... 
- Yarn 容量调度器多队列提交案例
		目录 Yarn 容量调度器多队列提交案例 需求 配置多队列的容量调度器 1 修改如下配置 SecureCRT的上传和下载 2 上传到集群并分发 3 重启Yarn或yarn rmadmin -refre ... 
- 服务器数据恢复方法_存储raid硬盘离线数据恢复案例
		[故障描述]某法院的一台HP-P4500的存储系统,底层是12块1TB的硬盘组的RAID.其中每6个1TB的盘一组,第一组的前面一部分组了一个RAID0+1,是存放HP-P4500嵌入式系统,接着组了 ... 
- RAC OCR盘故障导致的集群重启恢复
		一.事故说明 最近出现了一次OCR盘的故障导致Oracle集群件宕机的事故,后以独占模式启动集群,并使用ocr备份恢复了OCR文件以及重新设置了vote disk,然后关闭集群,重启成功. 因此在此处 ... 
- 【故障公告】数据库服务器 CPU 近 100% 引发的故障(源于 .NET Core 3.0 的一个 bug)
		非常抱歉,这次故障给您带来麻烦了,请您谅解. 今天早上 10:54 左右,我们所使用的数据库服务(阿里云 RDS 实例 SQL Server 2016 标准版)CPU 突然飙升至 90% 以上,应用日 ... 
- 【故障公告】10:30-10:45 左右 docker swarm 集群节点问题引发故障
		非常抱歉,今天 10:30-10:45 左右由于 docker swarm 集群节点出现问题,造成除博客之外的站点出现访问异常,由此给您带来很大的麻烦,请您谅解. 故障开始时出现有时访问正常有时访问出 ... 
随机推荐
- 工控领域上云实践-Zstack和软赢
			工业以太网常见五大协议对比 大规模电机控制的方案选择-电机和驱动器篇 大规模电机控制的方案选择-控制器篇 工控领域有各种各样的总线来通讯以控制设备,很小众的接口规范慢慢的更小众了,最常见的接口规范就是 ... 
- 微信小程序自定义导航栏机型适配
			自定义微信小程序头部导航栏,有几种方式 方式一 { "navigationStyle": "custom" // 将navigationStyle从默认defa ... 
- 奇迹网站编辑保存的时候提示Access is denied
			出现上面这个情况 只有在IIS模式下运行奇迹MU网站系统才会出现这个问题. 解决办法: 给网站目录赋予everyone权限 1.在网站目录右键属性 2在文件夹属性界面,点击"安全" ... 
- spring boot 配置Bean
			package com.example.demo.config; import com.example.demo.entiy.User; import org.springframework.cont ... 
- loj3076
			参照 E_Space 的候选队论文,我们建出广义串并联图进行「删一度点」「缩二度点」「叠合重边」操作合并信息的表达式树. 我们把其描述成一颗 Leafy Tree. 我们不妨在每个叶节点处存一个点或者 ... 
- Android Studio连接SQLlite
			1. MainActivity.java package com.example.dbproject;import android.database.sqlite.SQLiteDatabase;imp ... 
- AWK  nr  nf
			https://blog.csdn.net/sh13661847134/article/details/118018456 awk中NF,NR的含义awk中NF和NR的意义,其实你已经知道NF和NR的 ... 
- Neo4j插件安装
			Neo4j插件安装 Author:wss Date:2022.6.9 Topic:Neo4j插件安装 一.前言 昨天再次安装Apoc插件,又去找之前看的教程,有些地方不够清晰要几个教程对比着看,想到可 ... 
- 【面试题】ES6语法五之箭头函数
			ES6特性=>. function foo(x, y){ return x + y } var foo = (x, y) => x + y 包括一个参数列表(零个或多个参数,如果参数不是一 ... 
- 2022-05-12内部群每日三题-清辉PMP
			1.项目团队成员将因积极工作和满足项目成本目标而获得奖励.高级经理向项目经理询问团队成员的可用性和旅行偏好,项目经理可以在哪里获得奖励的定义标准和频率? A.责任分配矩阵(RAM) B.项目管理计划 ... 
