我们有一个生产 SQL Server 数据库服务器,将事务日志备份传送到两台备用服务器。灾难恢复计划已经完成:我们有一个完整的程序和经过培训的人员,可以将备用服务器投入生产、启动复制、启用作业等,并将停机时间降至最低。
正在讨论的问题不是应急计划本身,而是将备用服务器投入生产并丢失,在最坏的情况下,12 分钟的信息(事务日志备份每 10 分钟运行一次,速度非常快)复制到其他服务器)。
做出决定可能很困难,因为我们可能会浪费时间试图找出问题。另一方面,问题可能很容易解决,我们可以在不使用其他服务器的情况下将服务器重新投入生产。
我们明白,一旦系统出现故障,情况会变得非常紧张,我们认为在这些情况下,最好有一个标准的程序和最少的决定。
所以,我们有一个两难选择。是在主服务器出现问题时更换服务器更好,还是尝试识别并解决主服务器中的问题更好?大家怎么看这件事?