我们有一个旧的 HP DL380 G3,在 RAID 10 阵列中带有 6x36GB Ultra320 SCSI 驱动器。我们仔细监控驱动器,因为它们很旧 - SMART 故障前指示都显示正常。然后 4 天后,2 个驱动器发生故障(实际上这些驱动器可能没有发生物理故障,但 2 个驱动器上的数据已损坏)。这怎么会发生?我不是一个非常相信同时发生和机会的人。
我可以相信单个驱动器故障,但多次故障使我相信还有更多事情发生。我听说 DL380 上的 SCSI 背板可能会发生故障 - 任何人都可以从经验中证实这一点吗?我们应该更换 SCSI 背板吗?重建阵列时是否应该更换所有驱动器?
编辑:我查看了我们最近记录的有关此阵列中驱动器上累计运行小时数的一些统计数据。发生故障的 2 个驱动器的运行年数分别为 0.6 和 2.7 年。在我看来,这似乎否定了驱动器以完全相同的速度恶化并因此非常接近地失败的理论。除非累积的运行时间数据不比SMART更值得信赖?
hardware ×1