如何从 RAID 5 配置中的驱动器故障中恢复?

Phi*_*rie 16 hardware disaster-recovery raid5 drive-failure

今天早上,我们的数据库服务器上的一个驱动器出现故障。驱动器阵列(3 个磁盘)设置为 RAID 5 配置。

在等待驱动器更换期间,我们正在准备恢复策略。用户继续在系统上工作,尽管速度很慢(不知道为什么??)。

如何安装新驱动器 - 该驱动器的数据会自动从奇偶校验重建还是我们应该遵循另一个过程?

编辑: 这是一个硬件 RAID 控制器。(感谢到目前为止的答案,不胜感激)

Con*_*lls 15

系统运行非常缓慢,因为它必须重建丢失的数据,这涉及额外的 CPU 和 I/O。

如果您在 RAID-5 配置中缺少磁盘,则您没有恢复策略。如果另一个磁盘出现故障,您将丢失数据。跑,不要走,到最近的供应商那里,您可以从那里获得由当日紧急快递运送的制造商保修范围内的兼容部件。如果您从其购买阵列的供应商已经在获取部件的过程中,请获取这两个部件并将另一个作为备用。

如果您将 RAID-5 用于生产系统,您应该考虑在阵列中保留一个备用磁盘作为热备用。

添加 - 如果您的日志不在单独的卷(物理上单独的磁盘)上,请将它们移动到一组单独的磁盘,即使只是一个镜像对。如果您的数据库有任何显着负载,这也将是一个性能优势,因为日志卷上的争用对性能有不成比例的不良影响。

如果可能,您还可以通过执行以下操作使您的数据库更加健壮:

  1. 关闭数据库。
  2. 备份数据库。
  3. 将日志移动到物理上独立的一组磁盘(确保重新配置数据库,以便它知道日志已移动到何处)。
  4. 重新启动数据库和应用程序。

如果您将日志保存在单独的卷上,则当且仅当磁盘故障不会危及日志时,您才能从备份还原和前滚。出于以下原因(其中包括),数据库日志应位于单独的磁盘卷上:

  • 日志使用模式主要是顺序的,将日志条目附加到文件的末尾(该文件实际上是一个环形缓冲区)。这意味着可以快速写出大量日志条目,因为几乎没有磁盘磁头搜索活动。

  • 如果它们共享具有大量随机访问工作负载(例如事务表和索引)的物理磁盘,则由于磁头搜索活动会中断顺序写入,它们将被不成比例地减慢。

  • 将日志放在一个单独的卷上几乎总是一个性能胜利,并且只需要一个镜像对日志来支持相当繁重的工作负载。这意味着执行此操作的硬件非常便宜,因此只需很小的成本即可获得巨大的性能和可靠性。

  • 如果您的数据阵列出现故障,日志不会丢失。如果您有适当的备份策略,您可以从备份中恢复并从日志中向前滚动。这意味着整个阵列可以在服务器上停机而不会出现单点故障。日志和数据阵列必须同时发生故障才能导致数据丢失。


DrS*_*ker 5

1) 备份。

目前没有数据丢失。如果您的备份不是最新的备份。

2)阅读手册,致电供应商等。

不同的 RAID 系统有不同的更换磁盘的步骤,如果做错了,你可能会破坏整个阵列。在不知道您拥有哪种 RAID 硬件/软件的情况下,我们只能猜测所需的步骤。

此外,性能缓慢是因为处于降级状态(即:一个磁盘死机)的 RAID 5 具有可怕的读取性能。有多可怕取决于奇偶校验的存储方式以及哪个磁盘已死,但“好”消息是一个磁盘消失后性能缓慢是一个已知问题,不会引起恐慌。