由于发生了单点故障,笔者最近处理了一个case,其中一些经验非常希望和大家分享。

问题原因:

Technorati 标签: VMware,虚拟机,vmx,锁定,干货

某环境使用VMware的ESXi5.1的平台搭建的,存储使用iSCSI进行连接,Manage和业务口分离,但是Manage本身为单点环境非冗余,并且iSCSI的流量也经过该端口进行连接。某日网络交换机故障导致了存储与ESXi主机的失联,等待网络恢复之后,部分虚拟机自己活了过了,并对外正常提供业务,而部分虚拟机在VCenter中看到灰色不可用状态,直接登录到ESXi主机上显示UnknownNUM字样。并且事发之后有多个操作人员在奋力齐修,但是始终有几台虚拟机不能被添加到清单中,体现的样子如下图所示。

Figure 1浏览存储添加虚拟机配置文件到清单项目为灰色不可用

问题是这么考虑的

有两个方向:拼凑虚拟机——通过新建VM,磁盘选择该文件夹下的VMDK文件;另一个方向就是从VM层面考虑是不是磁盘文件损坏,文件被锁等问题。

解决问题

根据第一种方法,经过各种拼凑和组装,最后得到的结果就是怎么都不行,各种报错中间总会夹杂着文件不能被锁定磁盘vmdk依赖的文件不可被访问等等信息。

那就转投第二种方法,想到前面查看加载清单出现的状况,加载清单出现灰色条目表示不可用,但文件有大小,被占用的可能性越来越大,通过登录到ESXi主机里面直接查看文件占用情况了解到的情况如下:

Figure 2使用vmkfstools -D 查看某文件的锁定状态,红色标记看到Lock字样标识锁定,黄色标记表明该文件被这个MAC地址的主机锁定

现在问题又来了,在管理众多ESXi主机的VC下面寻找到一个小小的主机MAC目测是件很木乱还要看运气的事情,有没有什么便捷的办法快速定位这个问题?

这里推荐一款VMware相关的第三方小工具RVTools(作者Rob de Veij是VMware公司4年的vExpert),它可以统一查看很多虚拟化和主机信息,包括本例中你的主机MAC,统一查看存储名称和内部URL映射关系表,同时这些信息均可以被导出。

Figure 3通过该工具可以在vNIC选项卡下面可以很方便的查找到对应的主机和MAC对应关系

问题得以解决

最后通过VMware Client程序登录到对应主机,从其中浏览存储,将失联的虚拟机添加到清单中即可。

小结

解决问题的方向有时候比技术更有指向性,需要在合适的情况下指定合理有效的维修方案,使得问题迅速解决。

RVTools算是本文的干货软件,大家可以通过官方链接订阅下载,同时有更新的时候也会通过邮件系统发送到您的邮箱,当然也可以点击下面的链接直接从cnBlogs下载,本地下载3.6版

本文参考:VMware KB 2180803

VMware-存储断网之后无法添加vmx到清单的更多相关文章

  1. 解决Windows Server 2012 在VMware ESXi中经常自动断网问题

    最近一些开发人员反映他们使用的 Windows server2012 R2 虚拟机过段时间就远程连接不上了,ping也不通(已关闭防火墙),我们登录ESXi发现,Windows Server 的网络图 ...

  2. 30分钟玩转Net MVC 基于WebUploader的大文件分片上传、断网续传、秒传(文末附带demo下载)

    现在的项目开发基本上都用到了上传文件功能,或图片,或文档,或视频.我们常用的常规上传已经能够满足当前要求了, 然而有时会出现如下问题: 文件过大(比如1G以上),超出服务端的请求大小限制: 请求时间过 ...

  3. ubuntu wifi连接不上或经常断网,重启就好

    问题1.知道wifi密码,驱动也有,可以点击连接,总是提示"连接断开,您现在处于离线状态". 1.打开终端"ctrl+alt+T" 2.输入: sudo vim ...

  4. Android 动态监听网络 断网重连

    需求: 网络连接断开 弹出popupwindow 当前网络连接断开 网络恢复时popupwindow 消失重新请求网络. 需求描述完毕 上一张帅图 思路:广播 发送及时消息 断网flag  popup ...

  5. ARP攻击之Kali Linux局域网断网攻击

    特别声明: 我们学习研究网络安全技术的目的应是为了维护网络世界的安全,保护自己和他人的私有信息不被非法窃取和传播.请您遵守您所在地的法律,请勿利用本文所介绍的相关技术做背离道德或者违反法律的事情. S ...

  6. arp断网攻击

    arp断网攻击可以是同局域网内主机无法上网!(可恶搞室友哦,嘻嘻!) 实现原理 arp的中文释义是地址解析协议,全英文 address resolution protocol,是一个将局域网IP地址映 ...

  7. 用kali执行arp攻击-----------使对方断网

    实现原理 其主要原理是局域网内的"攻击机"通过冒充同网络号下的"受害者主机"的物理地址(mac地址),通过欺骗网关,让网关原来应该发给"受害者主机&q ...

  8. 断网环境下利用pip安装Python离线安装包

    这几天搞Windows离线断网环境下安装Python包,配置环境,各种坑!做个记录,供以后查询吧. # 生产环境 windows 7 # python 2.7.9 # pip 1.5.2 友情提示:当 ...

  9. 安卓webview断网处理

    需求:webview在加载的时候如果网络断开,会显示默认的错误界面,长得很丑,需要单独写一个页面,在网路出错的时候显示,点击重试以后重新加载网页 乍看挺简单的需求,但在实际过程中页碰到了不少坑,主要是 ...

随机推荐

  1. Java多线程

    一:进程与线程 概述:几乎任何的操作系统都支持运行多个任务,通常一个任务就是一个程序,而一个程序就是一个进程.当一个进程运行时,内部可能包括多个顺序执行流,每个顺序执行流就是一个线程.   进程:进程 ...

  2. ASP.NET Core 之 Identity 入门(三)

    前言 在上一篇文章中,我们学习了 CookieAuthentication 中间件,本篇的话主要看一下 Identity 本身. 最早2005年 ASP.NET 2.0 的时候开始, Web 应用程序 ...

  3. 猫哥网络编程系列:HTTP PEM 万能调试法

    注:本文内容较长且细节较多,建议先收藏再阅读,原文将在 Github 上维护与更新. 在 HTTP 接口开发与调试过程中,我们经常遇到以下类似的问题: 为什么本地环境接口可以调用成功,但放到手机上就跑 ...

  4. C++ std::set

    std::set template < class T, // set::key_type/value_type class Compare = less<T>, // set::k ...

  5. C++的内存泄漏检测

    C++大量的手动分配.回收内存是存在风险的,也许一个函数中一小块内存泄漏被重复放大之后,最后掏空内存. 这里介绍一种在debug模式下测试内存泄漏的方法. 首先在文件的开头以确定的顺序写下这段代码: ...

  6. Configure a VLAN on top of a team with NetworkManager (nmcli) in RHEL7

    SOLUTION VERIFIED September 13 2016 KB1248793 Environment Red Hat Enterprise Linux 7 NetworkManager ...

  7. 用Kotlin实现Android定制视图(KAD 06)

    作者:Antonio Leiva 时间:Dec 27, 2016 原文链接:https://antonioleiva.com/custom-views-android-kotlin/ 在我们阅读有关c ...

  8. Spring WebService入门

    Web service是一个平台独立的,低耦合的,自包含的.基于可编程的web的应用程序,可使用开放的XML(标准通用标记语言下的一个子集)标准来描述.发布.发现.协调和配置这些应用程序,用于开发分布 ...

  9. 我的MYSQL学习心得(二) 数据类型宽度

    我的MYSQL学习心得(二) 数据类型宽度 我的MYSQL学习心得(一) 简单语法 我的MYSQL学习心得(三) 查看字段长度 我的MYSQL学习心得(四) 数据类型 我的MYSQL学习心得(五) 运 ...

  10. CentOS7下自定义目录安装mono+jexus教程

    一.阅读前须知: 1.本文属于安装完Centos7之后的步骤 2.如果还不了解mono,请点击mono 3.本篇主要内容是使用自定义目录安装mono+jexus教程,使用默认目录请查看使用默认目录安装 ...