我的硬盘有故障吗?

Mic*_*hel 42 hard-drive smart smartctl

我只是尝试在我的硬盘上运行测试,但它不想完成自测。结果如下:

smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       697
  3 Spin_Up_Time            0x0027   206   160   021    Pre-fail  Always       -       691
  4 Start_Stop_Count        0x0032   074   074   000    Old_age   Always       -       26734
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       28
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7432
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3186
191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       20473
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       84
193 Load_Cycle_Count        0x0032   051   051   000    Old_age   Always       -       447630
194 Temperature_Celsius     0x0022   113   099   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       16
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%      7432         92290592
# 2  Conveyance offline  Completed: read failure       90%      7432         92290596
# 3  Conveyance offline  Completed: read failure       90%      7432         92290592
# 4  Short offline       Completed: read failure       90%      7431         92290596
# 5  Extended offline    Completed: read failure       90%      7431         92290592
Run Code Online (Sandbox Code Playgroud)

那么这个磁盘失败了吗?

Mad*_*ter 43

你的驱动很乐意做自检;从总结来看,它在过去的一个小时内已经完成了其中的五个。所有这些都失败了,在测试的早期,读取错误。

是的,这个硬盘坏了。正如著名的 Google Labs 报告所说(尽管我目前无法提供指向它的链接),如果smartctl说您的驱动器出现故障,那可能是(我解释一下)。

编辑:不要试图保存它。取下所有数据,然后替换它。

  • 如果它失败了,那就是失败了。修复它在技术上可能是可行的,但与新驱动器的成本相比,成本效益极低。 (9认同)
  • @Michel 遗憾的是,没有自检错误并不能证明驱动器 * 没有 * 失败,但应始终将自检错误的存在视为 * 失败的证据。 (7认同)
  • @JorgeNerín <grin> 说得通!我之所以这么说,是因为 OP 开始时将他的驱动器拟人化:“*我只是尝试在我的硬盘上运行测试,**它不想完成**自我测试*”。我认为我们中的任何一个都不认为驱动器还活着,也不认为它自己安排自检! (2认同)

bwD*_*aco 10

为了回答您的问题,失败的 SMART 测试是即将发生驱动器故障的可靠迹象。您应该尽快备份数据并更换驱动器,以防止潜在的数据丢失。

@sj0h 提到了负载循环计数,非常高,为 447,630。(大多数现代硬盘驱动器设计为可承受 600,000 次加载/卸载循环。)这通常是由高级电源管理 (APM) 功能引起的,该功能试图通过在几秒钟后停放磁头(从盘片中卸载它们)来节省电量。闲置的。需要时将磁头装回到盘片上。在大多数系统上,硬盘驱动器会出现断断续续的断断续续的活动,这可能会导致发生大量加载/卸载循环。要关闭 APM,请在 root 提示符下运行以下命令:

smartctl -s apm,off /dev/sda
Run Code Online (Sandbox Code Playgroud)

每次系统重启或进入睡眠状态或驱动器以其他方式关闭时都需要运行此命令,因为在驱动器关闭时不会保留此设置。

根据我的经验,这样做将大大减少加载/卸载周期的数量,从而减少您将来再次遇到此类故障的机会。但是请注意,这样做会增加功耗和驱动器温度。如果驱动器持续在超过 50 °C 的温度下运行,则过早发生故障的风险会增加,因此您可能希望在温暖的月份保持 APM 开启(如果关闭则将其打开)。