SQL Server 可用性组的故障转移需要多长时间?

And*_*ton 2 sql-server failover availability-groups metrics

在尝试确定最合适的高可用性选项时,我们专注于减少停机时间(计划内或计划外)。我已经能够收集有关故障转移群集实例 (FCI) 的统计信息(通过阅读大量 MSDN 文档和博客)。

我还没有找到有关可用性组的故障转移统计信息/次数的文档。

作为比较 (FCI):
故障转移 2008R2 集群的时间范围从 30 秒到 5 分钟不等(取决于流量以及硬件/网络设置):

进行手动故障转移时,它会完成对 LUN 的写入,将 LUN 切换到新的主动节点,并在新的主动节点上启动 SQL Server 实例。

在进行自动故障转移时,启动节点后,它将对数据库进行一致性检查并回滚任何进行中的事务。

可用性组
我知道,当您比较相同的硬件和流量时,可用性组应该能够更快地进行故障转移。

我无法找到比较两者的任何真实世界的实际指标。

具体来说,是否有人对正在积极使用的可用性组中的主写入节点进行故障转移所需的时间有任何指标
(故障转移到同步辅助)理想情况下,这将包括对任何 Microsoft 或可信赖来源的引用。请不要基于意见,只有指标。

Nic*_*Nic 7

FCI 和 AG 故障转移经验的个人观察,具有合理的大容量事务系统(40k trx/sec)。对于每个考虑 6 个数据库,大小从 500MB 到 4TB 不等。列出的故障转移时间是数据库在新节点上启动并处于可写状态所需的时间。您的里程可以并且会有所不同,但这至少是您的数据点。

集群故障转移:47 秒(平均)

AG 故障转移:10 秒