我有一个使用了一个多月的 NAS 设备。它被配置为通过电子邮件发送从硬盘驱动器的 SMART 数据生成的警报。一天后,其中一个硬盘驱动器报告一个扇区损坏并被重新分配。在第一周,这个数字攀升到有问题的硬盘驱动器的六个扇区。一个月后,这个数字达到了 9 个重新分配的扇区。这个速度似乎肯定在减速。
NAS 在 RAID-5 配置中配置了六个 1.5 TB 驱动器。使用如此大容量的驱动器,我预计某个扇区会不时出现故障,因此我并不担心最初的几个扇区何时被重新定位。尽管其他磁盘都没有报告任何问题,但让我感到困扰。
我应该开始担心驱动器的健康状况吗?这可能会因驱动器的容量而异吗?
我有一台作为 NexentaStor 存储单元运行的HP ProLiant DL380 G7 服务器。该服务器具有 36GB RAM、2 个 LSI 9211-8i SAS 控制器(无 SAS 扩展器)、2 个 SAS 系统驱动器、12 个 SAS 数据驱动器、一个热备盘、一个 Intel X25-M L2ARC 缓存和一个 DDRdrive PCI ZIL 加速器。该系统为多个 VMWare 主机提供 NFS。我的阵列上还有大约 90-100GB 的去重数据。
我遇到过两次性能突然下降的事件,导致 VM 来宾和 Nexenta SSH/Web 控制台无法访问,并且需要完全重新启动阵列才能恢复功能。在这两种情况下,都是 Intel X-25M L2ARC SSD 出现故障或“离线”。NexentaStor 未能就缓存故障向我发出警报,但在(无响应)控制台屏幕上可以看到常规 ZFS FMA 警报。

该zpool status输出显示:
pool: vol1
state: ONLINE
scan: scrub repaired 0 in 0h57m with 0 errors on Sat May 21 05:57:27 2011
config:
NAME STATE …Run Code Online (Sandbox Code Playgroud)