在最近的 AWS RDS 故障转移计划中,我们经历了大约 20 分钟的长时间恢复。AWS 提供了一些关于原因的提示。
大型事务或冗长的恢复过程会增加故障转移时间。
数据库本身并没有大量使用大型事务,所以我认为这不是罪魁祸首。因此,我有兴趣了解哪些因素可能导致漫长的恢复过程?
- SQL Server 版本是否有影响(我们在 2016 年)
- 数据库的大小有影响吗?
恢复过程大约需要 20 分钟,我们希望采取措施将其减少到大约 10 分钟。
更新:
我没有提到的一件事是,由于多年的糟糕设计,大约 50% 的数据库大小是由于存储了大量文件,例如 html 或 XML。这会对恢复时间有任何影响吗?