有没有人有使用 DRBD(协议 C)同步 2 台 esxi 主机的部分数据存储以对选定来宾进行灾难恢复的经验?
我有 2-3 个来宾,它们应该能够在尽可能短的时间内从主机的硬件故障中恢复,但仍然需要人工干预并且不会丢失太多数据。
我想构建这样的东西:
2 台 esxi 主机上的每台 1 DRBD VM 同步其本地 SAS 存储(主要/次要、主动/被动)。
此镜像存储应一次仅通过 ISCSI 或 NFS 连接到 1 个 esxi 主机,并用于这些来宾使其 vmdks 同步到第二个“被动”esxi 主机。如果发生硬件故障,第二台 esxi 主机应连接 DRBD 存储以启动这些虚拟机(当然是手动完成的)。
我在网上找到了一些关于这样做的信息,但我没有找到任何信息是 vmdks 的一致性。
虽然这当然不是备份的替代品,但虚拟机管理程序的备份工具通常会确保来宾的文件系统和数据库在拍摄快照或备份之前处于停顿状态。
但是,通过这种连续同步,这是不可能的。这就是为什么我想知道这是否值得做。
如果 vmdks 本身由于硬件故障发生在错误的时间而损坏怎么办。我知道 DRBD 会丢弃不完整的写入,但这是否足以让 vmdk 保持一致(从 esxi 的角度来看,意味着“工作”,除了来宾文件系统一致性,当然不能以这种方式保证)?
我希望,在发生崩溃的情况下,在第二个 esxi 上出现的来宾可以表现得好像 VM 只是不正常地关闭了(在其他情况下这通常可能具有所有可能的缺点),但这真的是案件?vmdks 不会整体损坏吗?
非常感谢您的阅读和您的想法。
最大限度
disaster-recovery synchronization drbd hypervisor vmware-esxi