由于发生了单点故障,笔者最近处理了一个case,其中一些经验非常希望和大家分享。

问题原因:

Technorati 标签: VMware,虚拟机,vmx,锁定,干货

某环境使用VMware的ESXi5.1的平台搭建的,存储使用iSCSI进行连接,Manage和业务口分离,但是Manage本身为单点环境非冗余,并且iSCSI的流量也经过该端口进行连接。某日网络交换机故障导致了存储与ESXi主机的失联,等待网络恢复之后,部分虚拟机自己活了过了,并对外正常提供业务,而部分虚拟机在VCenter中看到灰色不可用状态,直接登录到ESXi主机上显示UnknownNUM字样。并且事发之后有多个操作人员在奋力齐修,但是始终有几台虚拟机不能被添加到清单中,体现的样子如下图所示。

Figure 1浏览存储添加虚拟机配置文件到清单项目为灰色不可用

问题是这么考虑的

有两个方向:拼凑虚拟机——通过新建VM,磁盘选择该文件夹下的VMDK文件;另一个方向就是从VM层面考虑是不是磁盘文件损坏,文件被锁等问题。

解决问题

根据第一种方法,经过各种拼凑和组装,最后得到的结果就是怎么都不行,各种报错中间总会夹杂着文件不能被锁定磁盘vmdk依赖的文件不可被访问等等信息。

那就转投第二种方法,想到前面查看加载清单出现的状况,加载清单出现灰色条目表示不可用,但文件有大小,被占用的可能性越来越大,通过登录到ESXi主机里面直接查看文件占用情况了解到的情况如下:

Figure 2使用vmkfstools -D 查看某文件的锁定状态,红色标记看到Lock字样标识锁定,黄色标记表明该文件被这个MAC地址的主机锁定

现在问题又来了,在管理众多ESXi主机的VC下面寻找到一个小小的主机MAC目测是件很木乱还要看运气的事情,有没有什么便捷的办法快速定位这个问题?

这里推荐一款VMware相关的第三方小工具RVTools(作者Rob de Veij是VMware公司4年的vExpert),它可以统一查看很多虚拟化和主机信息,包括本例中你的主机MAC,统一查看存储名称和内部URL映射关系表,同时这些信息均可以被导出。

Figure 3通过该工具可以在vNIC选项卡下面可以很方便的查找到对应的主机和MAC对应关系

问题得以解决

最后通过VMware Client程序登录到对应主机,从其中浏览存储,将失联的虚拟机添加到清单中即可。

小结

解决问题的方向有时候比技术更有指向性,需要在合适的情况下指定合理有效的维修方案,使得问题迅速解决。

RVTools算是本文的干货软件,大家可以通过官方链接订阅下载,同时有更新的时候也会通过邮件系统发送到您的邮箱,当然也可以点击下面的链接直接从cnBlogs下载,本地下载3.6版

本文参考:VMware KB 2180803

VMware-存储断网之后无法添加vmx到清单的更多相关文章

  1. 解决Windows Server 2012 在VMware ESXi中经常自动断网问题

    最近一些开发人员反映他们使用的 Windows server2012 R2 虚拟机过段时间就远程连接不上了,ping也不通(已关闭防火墙),我们登录ESXi发现,Windows Server 的网络图 ...

  2. 30分钟玩转Net MVC 基于WebUploader的大文件分片上传、断网续传、秒传(文末附带demo下载)

    现在的项目开发基本上都用到了上传文件功能,或图片,或文档,或视频.我们常用的常规上传已经能够满足当前要求了, 然而有时会出现如下问题: 文件过大(比如1G以上),超出服务端的请求大小限制: 请求时间过 ...

  3. ubuntu wifi连接不上或经常断网,重启就好

    问题1.知道wifi密码,驱动也有,可以点击连接,总是提示"连接断开,您现在处于离线状态". 1.打开终端"ctrl+alt+T" 2.输入: sudo vim ...

  4. Android 动态监听网络 断网重连

    需求: 网络连接断开 弹出popupwindow 当前网络连接断开 网络恢复时popupwindow 消失重新请求网络. 需求描述完毕 上一张帅图 思路:广播 发送及时消息 断网flag  popup ...

  5. ARP攻击之Kali Linux局域网断网攻击

    特别声明: 我们学习研究网络安全技术的目的应是为了维护网络世界的安全,保护自己和他人的私有信息不被非法窃取和传播.请您遵守您所在地的法律,请勿利用本文所介绍的相关技术做背离道德或者违反法律的事情. S ...

  6. arp断网攻击

    arp断网攻击可以是同局域网内主机无法上网!(可恶搞室友哦,嘻嘻!) 实现原理 arp的中文释义是地址解析协议,全英文 address resolution protocol,是一个将局域网IP地址映 ...

  7. 用kali执行arp攻击-----------使对方断网

    实现原理 其主要原理是局域网内的"攻击机"通过冒充同网络号下的"受害者主机"的物理地址(mac地址),通过欺骗网关,让网关原来应该发给"受害者主机&q ...

  8. 断网环境下利用pip安装Python离线安装包

    这几天搞Windows离线断网环境下安装Python包,配置环境,各种坑!做个记录,供以后查询吧. # 生产环境 windows 7 # python 2.7.9 # pip 1.5.2 友情提示:当 ...

  9. 安卓webview断网处理

    需求:webview在加载的时候如果网络断开,会显示默认的错误界面,长得很丑,需要单独写一个页面,在网路出错的时候显示,点击重试以后重新加载网页 乍看挺简单的需求,但在实际过程中页碰到了不少坑,主要是 ...

随机推荐

  1. 如何一步一步用DDD设计一个电商网站(一)—— 先理解核心概念

    一.前言     DDD(领域驱动设计)的一些介绍网上资料很多,这里就不继续描述了.自己使用领域驱动设计摸滚打爬也有2年多的时间,出于对知识的总结和分享,也是对自我理解的一个公开检验,介于博客园这个平 ...

  2. dll文件32位64位检测工具以及Windows文件夹SysWow64的坑

    自从操作系统升级到64位以后,就要不断的需要面对32位.64位的问题.相信有很多人并不是很清楚32位程序与64位程序的区别,以及Program Files (x86),Program Files的区别 ...

  3. Jquery 搭配 css 使用,简单有效

    前几篇博客中讲了Jquery的基础和点击实际,下面来说一下和css搭配着来怎么做 还是和往常一样,举个例子 好几个方块,然后设置颜色 <!DOCTYPE html PUBLIC "-/ ...

  4. BootStrap_02之全局样式及组件

    1.BootStrap指定的四种屏幕尺寸: ①超大PC屏幕--lg(large):w>=1200px: ②中等PC屏幕--md(medium):1200px>w>=992px: ③P ...

  5. Sublime的使用

    1.一个可扩展性强的编辑工具 2.如何安装扩展 通过View->Show Console菜单打开命令行. 按图操作: 在控制台输入,然后回车: import urllib.request,os; ...

  6. [APUE]标准IO库(下)

    一.标准IO的效率 对比以下四个程序的用户CPU.系统CPU与时钟时间对比 程序1:系统IO 程序2:标准IO getc版本 程序3:标准IO fgets版本 结果: [注:该表截取自APUE,上表中 ...

  7. RSA算法

    RSA.h #ifndef _RSA_H #define _RSA_H #include<stdio.h> #include<iostream> #include<mat ...

  8. The first documents

    Mark~ 赶在2016年的年末,来开了一个blog. 想想以前开设的blog还是十多年前,时光飞逝~~ 开设这个blog的主要目的是用于自己平时一些知识的记录. 希望能在未来很长一段时间能坚持学习与 ...

  9. vue2.0构建淘票票webapp

    项目描述 之前一直用vue1.x写项目,最近为了过渡到vue2.0,特易用vue2.0栈仿写了淘票票页面,而且加入了express作为后台服务. 前端技术栈:vue2.0 + vue-router + ...

  10. 技术笔记:Delphi多线程应用读写锁

    在多线程应用中锁是一个很简单又很复杂的技术,之所以要用到锁是因为在多进程/线程环境下,一段代码可能会被同时访问到,如果这段代码涉及到了共享资源(数据)就需要保证数据的正确性.也就是所谓的线程安全.之前 ...