由于发生了单点故障,笔者最近处理了一个case,其中一些经验非常希望和大家分享。

问题原因:

Technorati 标签: VMware,虚拟机,vmx,锁定,干货

某环境使用VMware的ESXi5.1的平台搭建的,存储使用iSCSI进行连接,Manage和业务口分离,但是Manage本身为单点环境非冗余,并且iSCSI的流量也经过该端口进行连接。某日网络交换机故障导致了存储与ESXi主机的失联,等待网络恢复之后,部分虚拟机自己活了过了,并对外正常提供业务,而部分虚拟机在VCenter中看到灰色不可用状态,直接登录到ESXi主机上显示UnknownNUM字样。并且事发之后有多个操作人员在奋力齐修,但是始终有几台虚拟机不能被添加到清单中,体现的样子如下图所示。

Figure 1浏览存储添加虚拟机配置文件到清单项目为灰色不可用

问题是这么考虑的

有两个方向:拼凑虚拟机——通过新建VM,磁盘选择该文件夹下的VMDK文件;另一个方向就是从VM层面考虑是不是磁盘文件损坏,文件被锁等问题。

解决问题

根据第一种方法,经过各种拼凑和组装,最后得到的结果就是怎么都不行,各种报错中间总会夹杂着文件不能被锁定磁盘vmdk依赖的文件不可被访问等等信息。

那就转投第二种方法,想到前面查看加载清单出现的状况,加载清单出现灰色条目表示不可用,但文件有大小,被占用的可能性越来越大,通过登录到ESXi主机里面直接查看文件占用情况了解到的情况如下:

Figure 2使用vmkfstools -D 查看某文件的锁定状态,红色标记看到Lock字样标识锁定,黄色标记表明该文件被这个MAC地址的主机锁定

现在问题又来了,在管理众多ESXi主机的VC下面寻找到一个小小的主机MAC目测是件很木乱还要看运气的事情,有没有什么便捷的办法快速定位这个问题?

这里推荐一款VMware相关的第三方小工具RVTools(作者Rob de Veij是VMware公司4年的vExpert),它可以统一查看很多虚拟化和主机信息,包括本例中你的主机MAC,统一查看存储名称和内部URL映射关系表,同时这些信息均可以被导出。

Figure 3通过该工具可以在vNIC选项卡下面可以很方便的查找到对应的主机和MAC对应关系

问题得以解决

最后通过VMware Client程序登录到对应主机,从其中浏览存储,将失联的虚拟机添加到清单中即可。

小结

解决问题的方向有时候比技术更有指向性,需要在合适的情况下指定合理有效的维修方案,使得问题迅速解决。

RVTools算是本文的干货软件,大家可以通过官方链接订阅下载,同时有更新的时候也会通过邮件系统发送到您的邮箱,当然也可以点击下面的链接直接从cnBlogs下载,本地下载3.6版

本文参考:VMware KB 2180803

VMware-存储断网之后无法添加vmx到清单的更多相关文章

  1. 解决Windows Server 2012 在VMware ESXi中经常自动断网问题

    最近一些开发人员反映他们使用的 Windows server2012 R2 虚拟机过段时间就远程连接不上了,ping也不通(已关闭防火墙),我们登录ESXi发现,Windows Server 的网络图 ...

  2. 30分钟玩转Net MVC 基于WebUploader的大文件分片上传、断网续传、秒传(文末附带demo下载)

    现在的项目开发基本上都用到了上传文件功能,或图片,或文档,或视频.我们常用的常规上传已经能够满足当前要求了, 然而有时会出现如下问题: 文件过大(比如1G以上),超出服务端的请求大小限制: 请求时间过 ...

  3. ubuntu wifi连接不上或经常断网,重启就好

    问题1.知道wifi密码,驱动也有,可以点击连接,总是提示"连接断开,您现在处于离线状态". 1.打开终端"ctrl+alt+T" 2.输入: sudo vim ...

  4. Android 动态监听网络 断网重连

    需求: 网络连接断开 弹出popupwindow 当前网络连接断开 网络恢复时popupwindow 消失重新请求网络. 需求描述完毕 上一张帅图 思路:广播 发送及时消息 断网flag  popup ...

  5. ARP攻击之Kali Linux局域网断网攻击

    特别声明: 我们学习研究网络安全技术的目的应是为了维护网络世界的安全,保护自己和他人的私有信息不被非法窃取和传播.请您遵守您所在地的法律,请勿利用本文所介绍的相关技术做背离道德或者违反法律的事情. S ...

  6. arp断网攻击

    arp断网攻击可以是同局域网内主机无法上网!(可恶搞室友哦,嘻嘻!) 实现原理 arp的中文释义是地址解析协议,全英文 address resolution protocol,是一个将局域网IP地址映 ...

  7. 用kali执行arp攻击-----------使对方断网

    实现原理 其主要原理是局域网内的"攻击机"通过冒充同网络号下的"受害者主机"的物理地址(mac地址),通过欺骗网关,让网关原来应该发给"受害者主机&q ...

  8. 断网环境下利用pip安装Python离线安装包

    这几天搞Windows离线断网环境下安装Python包,配置环境,各种坑!做个记录,供以后查询吧. # 生产环境 windows 7 # python 2.7.9 # pip 1.5.2 友情提示:当 ...

  9. 安卓webview断网处理

    需求:webview在加载的时候如果网络断开,会显示默认的错误界面,长得很丑,需要单独写一个页面,在网路出错的时候显示,点击重试以后重新加载网页 乍看挺简单的需求,但在实际过程中页碰到了不少坑,主要是 ...

随机推荐

  1. 【小程序分享篇 一 】开发了个JAVA小程序, 用于清除内存卡或者U盘里的垃圾文件非常有用

    有一种场景, 手机内存卡空间被用光了,但又不知道哪个文件占用了太大,一个个文件夹去找又太麻烦,所以我开发了个小程序把手机所有文件(包括路径下所有层次子文件夹下的文件)进行一个排序,这样你就可以找出哪个 ...

  2. NodeJs之log4js

    log4js log4js是一个管理,记录日志的工具. 其实与morgan的作用类似. 安装 npm install -g log4js log4js的6个日志级别 分别是:trace(蓝色).deb ...

  3. 安卓易学,爬坑不易——腾讯老司机的RecyclerView局部刷新爬坑之路

    针对手游的性能优化,腾讯WeTest平台的Cube工具提供了基本所有相关指标的检测,为手游进行最高效和准确的测试服务,不断改善玩家的体验.目前功能还在免费开放中. 点击地址:http://wetest ...

  4. TortoiseGit 文件比对工具使用 Beyond Compare 和 DiffMerge

    TortoiseGit 内置的文件比对工具是 TortoiseMerge,用于文件比对和解决冲突合并,TortoiseGit 还支持外部的比对工具使用,比如 Beyond Compare 和 Diff ...

  5. 【置顶】CoreCLR系列随笔

    CoreCLR配置系列 在Windows上编译和调试CoreCLR GC探索系列 C++随笔:.NET CoreCLR之GC探索(1) C++随笔:.NET CoreCLR之GC探索(2) C++随笔 ...

  6. .NET CoreCLR开发人员指南(上)

    1.为什么每一个CLR开发人员都需要读这篇文章 和所有的其他的大型代码库相比,CLR代码库有很多而且比较成熟的代码调试工具去检测BUG.对于程序员来说,理解这些规则和习惯写法非常的重要. 这篇文章让所 ...

  7. Java 时间类-Calendar、Date、LocalDate/LocalTime

    1.Date 类 java.util.Date是一个"万能接口",它包含日期.时间,还有毫秒数,如果你只想用java.util.Date存储日期,或者只存储时间,那么,只有你知道哪 ...

  8. 浅谈JSP中include指令与include动作标识的区别

    JSP中主要包含三大指令,分别是page,include,taglib.本篇主要提及include指令. include指令使用格式:<%@ include file="文件的绝对路径 ...

  9. 【Linux大系】Linux的概念与体系

    感谢原作者:Vamei 出处:http://www.cnblogs.com/vamei 我在这一系列文章中阐述Linux的基 本概念.Linux操作系统继承自UNIX.一个操作系统是一套控制和使用计算 ...

  10. NGINX引入线程池 性能提升9倍

    1. 引言 正如我们所知,NGINX采用了异步.事件驱动的方法来处理连接.这种处理方式无需(像使用传统架构的服务器一样)为每个请求创建额外的专用进程或者线程,而是在一个工作进程中处理多个连接和请求.为 ...