Mar*_*son 3 high-availability fault-tolerance
我们正在审查新客户给我们带来的系统要求。他们在医疗领域工作,他们希望我们托管的系统必须至少具有高可用性,并且最好是容错的。
我们正在考虑授权 VMWare Enterprise 以通过 FT 兼容硬件获得其 HA 和 FT 功能。没什么大不了的 - 10Gbs 以太网的价格正在下降,而 1Gb 以太网不是问题。
然而,客户的要求之一是我们有一个位于完全不同城市的 HA(不是 FT,但 FT 会很好)站点。
带宽在澳大利亚是疯狂昂贵的,我甚至不知道它可能获得悉尼和墨尔本(约千公里/ 600英里外)之间的1Gbps的链接。我可能很难在两个城市之间建立 100Mbps 的链接。
提供 HA 系统的选项有哪些?不必使用 VMWare,但如果一个站点出现故障,我需要能够登录到第二个站点并点击“开始”按钮并启动并运行。
我目前正处于为 $WORK 设置 DR/HA 远程数据中心的初始规划/实施阶段。我们当前的环境已经高度虚拟化,无论是在服务器虚拟化 (VMware) 还是存储虚拟化 (Compellent SAN) 方面。因此,我们认为利用这些技术及其可用的 HA 解决方案是最有意义的。
我们所有的 VMFS 卷目前都位于 Compellent SAN 上,我们将使用它们的卷异步卷复制来使远程站点的另一个 SAN 上的内容保持相对同步(可能每 15 分钟一次)。然后,对于 VM 本身,我们使用 VMware 的 SRM。我猜你已经听说过很酷的产品。如果您愿意,它几乎可以将故障转移抽象/自动化到您的辅助数据中心,只需单击一个按钮。很圆滑。
对我们来说幸运的是,我们在站点之间有一个 GigE 链接,我们将用于 SAN 复制(除其他外)。当每 15 分钟同步一次时,我们案例中的音量增量不会那么大。根据客户系统的流失程度,通过 100Mbps 链接(甚至更小)保持同步可能并不困难。我知道其他 Compellent 客户通过单个 T1 进行同步。显然,那里没有发生大量的数据更改......
无论如何,这里有几件事情需要考虑:
这就是我目前的所有建议。在我(希望)接近完成我们的 DR 系统的六个月后,我相信我会学到更多的东西。:) 祝好运并玩得开心点!