有多少 SMART 扇区重新分配表明存在问题?

Jer*_*emy 18 raid hard-drive smart bad-blocks

我有一个使用了一个多月的 NAS 设备。它被配置为通过电子邮件发送从硬盘驱动器的 SMART 数据生成的警报。一天后,其中一个硬盘驱动器报告一个扇区损坏并被重新分配。在第一周,这个数字攀升到有问题的硬盘驱动器的六个扇区。一个月后,这个数字达到了 9 个重新分配的扇区。这个速度似乎肯定在减速。

NAS 在 RAID-5 配置中配置了六个 1.5 TB 驱动器。使用如此大容量的驱动器,我预计某个扇区会不时出现故障,因此我并不担心最初的几个扇区何时被重新定位。尽管其他磁盘都没有报告任何问题,但让我感到困扰。

我应该开始担心驱动器的健康状况吗?这可能会因驱动器的容量而异吗?

Ins*_*yte 22

重新阅读谷歌关于该主题的论文“大型磁盘驱动器群体中的故障趋势”,我想我可以肯定地说亚当的答案是不正确的。在他们对大量驱动器的分析中,大约 9% 的重新分配计数为非零。有说服力的报价是这样的:

在第一次重新分配后,驱动器在 60 天内发生故障的可能性是没有重新分配计数的驱动器的 14 倍以上,因此该参数的临界阈值也是一个。

在处理“离线重新分配”时更有趣,这是在驱动器的后台清理期间发现的重新分配,而不是在实际请求的 IO 操作期间。他们的结论:

在第一次离线重新分配后,驱动器在 60 天内发生故障的几率是没有离线重新分配的驱动器的 21 倍以上;这种效果再次比总的重新分配更为剧烈。

从现在开始,我的政策是重新分配计数非零的驱动器将被安排更换。


Ada*_*vis 13

与大多数组件一样,驱动器具有浴盆曲线故障率。他们一开始失败了很多,中间失败率相对较低,然后到了生命的尽头,失败了很多。

正如整个驱动器遵循这条曲线一样,磁盘的特定区域也将遵循这条曲线。在开始使用驱动器时,您会看到很多扇区重新分配,但这应该会逐渐减少。当驱动器在使用寿命结束时开始出现故障时,它将开始丢失越来越多的扇区。

您不需要担心 6(取决于驱动器 - 咨询制造商),但您需要观察并查看每个新重新分配的频率。如果恶化加速或保持不变,请担心。否则,在最初的磨合期之后应该没问题。

-亚当

  • 谷歌不是彻底揭穿了“浴缸曲线”理论吗? (5认同)