如何检查 RAID 阵列中单个硬盘的健康状况？

Question

如何检查 RAID 阵列中单个硬盘的健康状况？

Jay*_*D3e 5 raid ubuntu hard-drive

我正在 Ubuntu Server 10.10 上使用 mdadm 运行一个简单的 1 TB RAID 1 阵列。我想简单地检查每个硬盘驱动器的状态，以确保它们都可以正常工作，以免为时已晚。我怎么能轻易做到这一点？

Answer 1

Bit*_*nce 4

通常，您需要的是一个名为 smartmontools 的软件包。它可以查询磁盘上的 SMART 接口，大多数现代磁盘都有该接口。

有一个名为 smartd 的守护进程可以帮助您进行持续监控。

但是，如果您的系统是家庭服务器，则手动检查通常会更好。就像这样：

smartctl -a /dev/sda

大量数据涌出。我最感兴趣的内容如下：

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE

  1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       13946
 13 Read_Soft_Error_Rate    0x000e   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   075   066   000    Old_age   Always       -       25
194 Temperature_Celsius     0x0022   075   064   000    Old_age   Always       -       25
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   100   100   000    Old_age   Always       -       0

Run Code Online (Sandbox Code Playgroud)

这为您提供了一种主观衡量驱动器运行状况的方法。当错误率开始上升时，就该寻找替代品了。此外，您还可以检查它们是否运行过热。

归档时间：	14 年，11 月前
查看次数：	13796 次
最近记录：	14 年，11 月前