作者:范军 (Frank Fan) 新浪微博:@frankfan7

Stretched Cluster是一把双刃剑,会用的如行云流水,用不好反而受其限制。

传统的vSphere Cluster是指一个Cluster内的所有ESXi主机都在一个物理机房内。Stretched Cluster顾名思义是把Cluster的概念扩展到了不受物理位置的限制。主机可以是在同一个数据中心的不同物理机房,甚至可以分布在不同城市的数据中心。听上去很酷吧,

是否采用Stretched Cluster需要缜密的评估和设计。以下三个步骤可以帮助你理清思路。

一 明确想要什么? 

容灾的大概念很模糊,每个人可能都有不同的理解。所以我们需要对以下几个名词吃透。

Disaster Recovery

在一个数据中心的应用意外中断后,在另外一个数据中心把该应用恢复。目的是在Infrastructure层出现大到故障的时候,应用可以在短时间内恢复,尽量减小影响。

Disaster Avoidance

通常指采用主动的措施来避免可能发生的应用中断。比如计划内的机房断电、飓风来袭,地震预警等等。在灾难发生之前,把应用从可能受影响的数据中心切换到另外一个安全的数据中心。在切换过程中可能有短时间内的服务中断。

Downtime Avoidance

与Disaster Avoidance不同,Downtime Avoidance更注重的是不能有服务的中断,不能有数据的损失。这也是vMotion和Storage vMotion大显身手之处。

Active Site Balancing

如果一个数据中心或者是Cluster专门为容灾而建,那么必须保证在灾难来临时有充足的空闲资源。很可能99.99%的时间内大量资源是闲置的。我们不希望灾难发生,可也希望能更有效的利用资源。怎么办?

Active Site Balancing指有效利用所有数据中心的所有资源,尽量避免资源闲置。

下图基于以上四个方面,对Site Recovery Manager 和 Stretched Cluster进行了比较。原文见此链接

如果你明确了Downtime  Avoidance和Active Site Balancing是你最最关注的方面,那么比起SRM来说,Stretched Cluster可能更好的满足需求。

二  评估是否满足先决条件

数据中心之间的距离在100KM之内

在两个数据中心内都可以访问扩展的二层网络。数据中心之间的网络延时(latency)<10ms

存储设备支持。查HCL。EMC VPLEX是支持的。我们后文详述。

其他细节见此文vSphere Metro Storage Cluster solutions, what is supported and what not? 链接

三 可能带来的影响

在方案设计中要解决好下面的问题:

Site Affinity

在数据中心A的主机仅仅能够访问本地的存储设备,对于数据中心B的主机,同理亦然。因为访问本地的速度快、可靠性高。

Failover Scenario

对所有可能出现中断的组件,都要验证中断的后果。比如有以下情形:

单个ESXi宕机、多个ESXi宕机、整个机房ESXi宕机、单个ESXi网络中断、数据中心之间用于存储同步的网络中断(StoragePartition)、数据中心之间二层网络中断(DataCenter  Partition)、存储阵列磁盘损坏、整个存储阵列宕机、整个数据中心中断

Operational Process

Stretched Cluster是高端技术,的确能解决不少问题。可有一点往往被人们忽视,就是其根本上是依赖于vSphereCluster的底层技术来支撑的。 vShpere Cluster本身有很多特性,比如vMotion,HA等等很不错,同样也有一些力不从心之处。比如在当数据中心A全面中断后,vSphere HA把虚拟机在另外一个数据中心B重新启动。启动顺序是无法保证的。而VMware SRM有完善的DR计划保证满足预先设计的启动顺序。

不能因为有Stretched Cluster就认为完事大吉,需要有严密的OperationalProcess来验证虚拟机极其支持的应用能够正常恢复。

参考:

VMwarevSphere Metro Storage Cluster Case Study

Implementing vSphere Metro Storage Cluster(vMSC) using EMC VPLEX

StretchedClusters and VMware vCenter Site Recovery Manager

vSphere Metro Storage Clustersolutions, what is supported and what not?

vSphere 5.0 HA and metro /stretched cluster solutions

【虚拟化实战】容灾设计之三Stretched Cluster的更多相关文章

  1. 【虚拟化实战】容灾设计之四VPLEX

    作者:范军 (Frank Fan) 新浪微博:@frankfan7 VPLEX等存储设备的出现,可以实现双活数据中心,最大程度的有效利用运算和存储资源. 在“容灾设计之三Stretched Clust ...

  2. 【虚拟化实战】存储设计之六latency

    在[虚拟化实战]存储设计之五IOPS中我们讲了评估存储性能的三个关键指标.也就是Throughput,IOPs和latency.以及三者之间的关系.本文深入介绍Latency过高的原因和一些建议. L ...

  3. 【虚拟化实战】容灾设计之一VR vs SRM

    作者:范军 (Frank Fan) 新浪微博:@frankfan7 从本文开始,我们将介绍一系列的关于容灾的解决方案.先探讨应用的场景,然后再深入介绍技术架构. 情景一: 某小型公司的虚拟化环境中,在 ...

  4. 从数据仓库双集群系统模式探讨,看GaussDB(DWS)的容灾设计

    摘要:本文主要是探讨OLAP关系型数据库框架的数据仓库平台如何设计双集群系统,即增强系统高可用的保障水准,然后讨论一下GaussDB(DWS)的容灾应该如何设计. 当前社会.企业运行当中,大数据分析. ...

  5. 【虚拟化实战】VM设计之一vCPU

    作者:范军 (Frank Fan) 新浪微博:@frankfan7 虚拟机需要多少个vCPU呢?是不是个数越多性能越好呢?这方面存在着很多误区.给VM配置CPU资源的时候,要精打细算才能最大可能的利用 ...

  6. 华为云计算IE面试笔记-请描述华为容灾解决方案全景图,并解释双活数据中心需要从哪些角度着手考虑双活设计

    容灾全景图: 按照距离划分:分为本地容灾 同城容灾 异地容灾  本地容灾包括本地高可用和本地主备.(本数据中心的两机房.机柜) 本地高可用这个方案为了保持业务的连续性,从两个层面来考虑: ①一个是从主 ...

  7. 删库到跑路?还得看这篇Redis数据库持久化与企业容灾备份恢复实战指南

    本章目录 0x00 数据持久化 1.RDB 方式 2.AOF 方式 如何抉择 RDB OR AOF? 0x01 备份容灾 一.备份 1.手动备份redis数据库 2.迁移Redis指定db-数据库 3 ...

  8. 传统业务上云:跨AZ容灾架构解析

    本文由  网易云发布. 数字化转型浪潮之下,采用云计算服务提升业务敏捷性.降低运维成本,成为了传统企业的优选方案.网易云资深解决方案架构师张亮通过某物流企业客户的实际案例,分享了传统业务系统在云上的架 ...

  9. Windows Server 2012 虚拟化实战:网络(二)

    关于Windows Server的虚拟化网络,前文描述了在操作系统层面上的出现的配置变化.其中的一些配置通过Windows Server提供的小工具即可实现,如网卡组的配置,而有些需要安装Window ...

随机推荐

  1. hdu 4885 TIANKENG’s travel(bfs)

    题目链接:hdu 4885 TIANKENG's travel 题目大意:给定N,L,表示有N个加油站,每次加满油能够移动距离L,必须走直线,可是能够为斜线.然后给出sx,sy,ex,ey,以及N个加 ...

  2. c,const和指针组合的几种意义

    const和指针的组合: 注释部分表示非法. ; ; p=&a; //*p = 1 ; ; pp= &a; //*pp = 1; ; //pv=&a; *pv = ; ; // ...

  3. winform之2---messagebox用法

    MessageBox.Show();可谓是winform开发中用的次数最多的东东啦.先贴一张msdn的图解 msdn好像没有更新哎,只提供了这几种方法,并且参数名称和最新的有差别,但实际上messag ...

  4. Arduino 入门程序示例之一排 LED(2015-06-11)

    概述 最简单的一个 LED 的实验之后,自然是增加几个 LED,咱排成一排来玩吧.最后,再把一排的 LED 排成一个 8 字来玩——七段数码管. 示例程序 流水灯 第一个出场的肯定是经典的流水灯,也叫 ...

  5. java--多线程之前台幕后

    前台程序是相对于后台程序来说的,那么什么是后台程序呢? [后台程序]就是在启动了start()之前,调用了setDaemon(true)方法,这个线程就变成了后台.如果一个进程中只用后台线程在运行,那 ...

  6. [置顶] 自娱自乐7之Linux UDC驱动2(自编udc驱动,现完成枚举过程,从驱动代码分析枚举过程)

    花了半个月,才搞定驱动中的枚举部分,现在说linux的枚举,windows可能有差别. 代码我会贴在后面,现在只是实现枚举,你可能对代码不感兴趣,我就不分析代码了,你可以看看 在<自娱自乐1&g ...

  7. Android应用开发经常使用知识

    在其它站点看到的,Mark一下 1.近期打开的应用不在近期任务列表中显示 android:excludeFromRecents="true" 设置为true,则排除在近期任务列表之 ...

  8. ListView 使用方法(Asp.Net)

    您将须要用到的独有数据绑定控件. Fritz Onion 代码下载位置: ExtremeASPNET2008_03.exe (192 KB) Browse the Code Online  文件夹 L ...

  9. webservice asmx 无法序列化接口 System.Collections.Generic.IList

    转载自:http://www.cnblogs.com/chenhuzi/p/4178194.html 今天有位同事在方法里加了一个IList<entity> 的返回值,也没有测试,直接发布 ...

  10. HDU 5046 Airport(DLX反复覆盖)

    HDU 5046 Airport 题目链接 题意:给定一些机场.要求选出K个机场,使得其它机场到其它机场的最大值最小 思路:二分+DLX反复覆盖去推断就可以 代码: #include <cstd ...