SAS 驱动器有几个坏块是正常的,还是应该尽快更换驱动器?

Nat*_*ate 5 raid hard-drive sas hardware-raid

我有一个驱动器——RAID 1 镜像的一部分——它有两个坏块。Adaptec Storage Manger 在检测到这些块时给我发了电子邮件。它显示该驱动器有 4 个中等错误,但状态仍为“最佳”。

这是我第一次使用 Adaptec RAID 控制器。我不知道偶尔出现坏块是否正常,或者我是否应该立即更换该驱动器。


更新:当天晚些时候驱动器出现故障!


磁盘子系统是:

  • 带有 ZMM 的 Adaptec 6405
  • (2) 希捷近线 SAS 硬盘 (ST31000424SS)

另一个驱动器尚未报告任何坏块。我正在运行一致性检查。

Adaptec 存储管理器屏幕截图

Chr*_*s S 7

在阵列中使用驱动器时,控制器将设置限时错误恢复。如果磁盘不能立即读取数据,这将导致磁盘报告介质错误。这并不意味着它们不会从读取错误中恢复,或者扇区完全不可读。
(便宜的 SATA 驱动器不支持 TLER,并且会导致读取操作在驱动器尝试恢复数据时挂起;这只是更便宜的 SATA 驱动器不应在阵列中使用的众多原因之一;这当然不适用到这个特定的问题)

如果磁盘确定该扇区不可读,它将重新映射该扇区。原来的坏道不会上报,所以操作系统上运行的软件无从得知。您唯一能做的就是查找 SMART 报告并查看是否/有多少扇区已被重新映射。许多部门正在重新映射,这是不好的事情即将到来的一个很好的迹象。SMART 还可以报告磁盘遇到软错误与硬错误的次数。

在任何情况下,SMART 故障前预测都无济于事;一项Google SMART Study支持这一点。


Nat*_*ate 2

我通常不回答我自己的问题,但在这种情况下我有一个明确的答案:尽快更换驱动器。当天晚些时候,有问题的驱动器出现故障。

\n\n

凌晨时分,我收到了三封如下所示的电子邮件。\xe2\x80\x99 是我知道驱动器有坏块的方式,也是唯一的警告:

\n\n
======================================================================================\n\nADAPTEC's EMAIL NOTIFICATION MANAGER (Instant)\n\n======================================================================================\n\nEvent Type   : Warning\nEvent Source    : storage@HV2.domain.local\nDate     : 06/29/2011\nTime     : 05:29:03 AM PDT\n\n--------------------------------------------------------------------------------------\nEvent(s) List With Description\n--------------------------------------------------------------------------------------\nBad Block discovered: controller 1 (21a6e00).\n--------------------------------------------------------------------------------------\n\n**[Note]:   This message was generated by the Adaptec Storage Manager Agent.\nPlease do not reply to this message.\n
Run Code Online (Sandbox Code Playgroud)\n\n

到了最后一天,它失败了。

\n