Google对硬盘驱动器故障进行了非常彻底的研究,发现很大一部分硬盘驱动器在大量使用的前 3 个月内出现故障。
我和我的同事认为我们可以为所有新硬盘驱动器实施老化过程,这可能会使我们免于在未经测试的新驱动器上浪费时间而感到心痛。但在我们实施老化过程之前,我们希望从其他更有经验的人那里获得一些见解:
编辑:由于业务的性质,大部分时间都无法使用 RAID。我们必须依靠在全国范围内频繁邮寄的单个驱动器。我们会尽快备份驱动器,但在我们有机会备份数据之前,我们仍然会在这里和那里遇到故障。
我的公司已经实施了一段时间的老化过程,事实证明它非常有用。我们立即烧毁所有库存的新驱动器,使我们能够在保修期满之前和将它们安装到新计算机系统之前发现许多错误。事实证明,验证驱动器是否已损坏也很有用。当我们的一台计算机开始遇到错误并且硬盘驱动器是主要嫌疑人时,我们将在该驱动器上重新运行老化过程并查看任何错误以确保驱动器确实是问题,然后再开始 RMA 过程或抛出它在垃圾桶里。
我们的老化过程很简单。我们有一个指定的 Ubuntu 系统,有很多 SATA 端口,我们在读/写模式下运行坏块,每个驱动器上有 4 次传递。为了简化事情,我们编写了一个脚本来打印“数据将从您的所有驱动器中删除”警告,然后在除系统驱动器之外的每个驱动器上运行坏块。
我正在设置两个新的 4TB 硬盘驱动器的 RAID1 阵列。
我以前在某个地方听说过,将同时购买的新相同硬盘驱动器制作成 RAID1 阵列会增加它们在相似时间点发生故障的可能性。
因此,我正在考虑单独使用其中一个硬盘驱动器一段时间(可能是几周),以尝试减少两者在短时间内出现故障的可能性。(未使用的驱动器将保持断开连接在抽屉中)
这似乎是一种合理的方法,还是我更有可能只是在浪费时间?