远程数据中心之间 HA 的最佳选择?

Mar*_*son 3 high-availability fault-tolerance

我们正在审查新客户给我们带来的系统要求。他们在医疗领域工作,他们希望我们托管的系统必须至少具有高可用性,并且最好是容错的。

我们正在考虑授权 VMWare Enterprise 以通过 FT 兼容硬件获得其 HA 和 FT 功能。没什么大不了的 - 10Gbs 以太网的价格正在下降,而 1Gb 以太网不是问题。

然而,客户的要求之一是我们有一个位于完全不同城市的 HA(不是 FT,但 FT 会很好)站点。

带宽在澳大利亚是疯狂昂贵的,我甚至不知道它可能获得悉尼和墨尔本(约千公里/ 600英里外)之间的1Gbps的链接。我可能很难在两个城市之间建立 100Mbps 的链接。

提供 HA 系统的选项有哪些?不必使用 VMWare,但如果一个站点出现故障,我需要能够登录到第二个站点并点击“开始”按钮并启动并运行。

EEA*_*EAA 5

我目前正处于为 $WORK 设置 DR/HA 远程数据中心的初始规划/实施阶段。我们当前的环境已经高度虚拟化,无论是在服务器虚拟化 (VMware) 还是存储虚拟化 (Compellent SAN) 方面。因此,我们认为利用这些技术及其可用的 HA 解决方案是最有意义的。

我们所有的 VMFS 卷目前都位于 Compellent SAN 上,我们将使用它们的卷异步卷复制来使远程站点的另一个 SAN 上的内容保持相对同步(可能每 15 分钟一次)。然后,对于 VM 本身,我们使用 VMware 的 SRM。我猜你已经听说过很酷的产品。如果您愿意,它几乎可以将故障转移抽象/自动化到您的辅助数据中心,只需单击一个按钮。很圆滑。

对我们来说幸运的是,我们在站点之间有一个 GigE 链接,我们将用于 SAN 复制(除其他外)。当每 15 分钟同步一次时,我们案例中的音量增量不会那么大。根据客户系统的流失程度,通过 100Mbps 链接(甚至更小)保持同步可能并不困难。我知道其他 Compellent 客户通过单个 T1 进行同步。显然,那里没有发生大量的数据更改......

无论如何,这里有几件事情需要考虑:

  • 小心你的交换 luns。它们很可能不需要被复制。当然,远端系统需要交换 lun,但您可能可以将这些 VM 重新映射到仅本地 lun。这样,您就无需担心复制无用数据的开销。
  • 确保您的 SAN 供应商有一些故障恢复计划。您不希望在故障转移站点上运行的生产环境“卡住”好几个月,因为您无法弄清楚如何在主站点恢复同步。
  • 这不言而喻,但测试,测试,测试。VMware SRM 使这非常容易执行,并且可以为您提供漂亮的故障转移测试报告以交给 PHB。
  • IP 寻址。在我们的例子中,我们在站点之间运行 802.1QinQ,因此在故障转移站点上运行时重新寻址服务器将(幸运的是)没有必要。但是,这确实需要来自每个站点的 BGP 广告(具有适当的权重),以及在每个站点维护的防火墙规则,以便当流量转移到故障转移站点时,事情会按预期工作。

这就是我目前的所有建议。在我(希望)接近完成我们的 DR 系统的六个月后,我相信我会学到更多的东西。:) 祝好运并玩得开心点!