如何检查 RAID 阵列中单个硬盘的健康状况?

Jay*_*D3e 5 raid ubuntu hard-drive

我正在 Ubuntu Server 10.10 上使用 mdadm 运行一个简单的 1 TB RAID 1 阵列。我想简单地检查每个硬盘驱动器的状态,以确保它们都可以正常工作,以免为时已晚。我怎么能轻易做到这一点?

Bit*_*nce 4

通常,您需要的是一个名为 smartmontools 的软件包。它可以查询磁盘上的 SMART 接口,大多数现代磁盘都有该接口。

有一个名为 smartd 的守护进程可以帮助您进行持续监控。

但是,如果您的系统是家庭服务器,则手动检查通常会更好。就像这样:

smartctl -a /dev/sda

大量数据涌出。我最感兴趣的内容如下:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE

  1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       13946
 13 Read_Soft_Error_Rate    0x000e   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   075   066   000    Old_age   Always       -       25
194 Temperature_Celsius     0x0022   075   064   000    Old_age   Always       -       25
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   100   100   000    Old_age   Always       -       0
Run Code Online (Sandbox Code Playgroud)

这为您提供了一种主观衡量驱动器运行状况的方法。当错误率开始上升时,就该寻找替代品了。此外,您还可以检查它们是否运行过热。