如何解读 HDD SMART 结果?

Mar*_*rty 68 hard-drive smart

我的笔记本电脑最近开始变得有点不可靠,出于某种原因,我开始怀疑我的硬盘开始出现故障。在互联网上进行了一番搜索后,我在系统菜单中找到了 Ubuntu 的磁盘实用程序,并从中运行了长时间的 SMART 诊断程序。

但是,由于磁盘工具的文档非常差(palimpsest?),我不确定如何解释结果:

读取错误率超过 5000 万,但测试良好?!

例如,读取错误率超过 5000 万 (!),但评估评级为“良好”。

那么有人介意向我解释如何解释这些测试的结果(尤其是标准化、最差、阈值和值数字)?也许告诉我他们对我的硬盘结果的看法?(谢谢)

Jav*_*era 65

您对 SMART 如何在wikipedia 上工作有很好的描述。但快速介绍:

  • 值:这是控制器报告的原始值。通常它是一个易于理解的值(如开机时间或温度),但有时并非如此(如读取错误率)。不同的制造商可以对这些数据使用不同的结构和含义。

  • 归一化:这是上述归一化的值,因此值越高越好。因此,114 的读取/错误率优于 113。同样,您的硬盘驱动器如何将原始数据转换为标准化值是特定于供应商的。

  • 最差:您的驱动器过去的最差归一化值(其中 99 可能是出厂设置)。

  • 阈值:当归一化低于此值时,驱动器可能会发生故障。

所以,你的硬盘似乎没问题。读取错误率的值不是您的驱动器出现故障的次数,而是某些取决于您的磁盘制造商的数据结构。


psu*_*usi 27

是的,通常读取错误率的原始值是无意义的。您要关注的值是重新分配的扇区数、待处理数和离线不可纠正数。这些是已经、正在等待或无法更正的坏扇区的计数,那里的原始值通常是有意义的,并且是扇区的计数。

如果读取扇区失败,它将变为挂起状态。下次您尝试写入该扇区时,驱动器会尝试重写它,如果成功,一切都会恢复正常。如果它不能正确写入扇区,那么它将从备用池中重新分配扇区。如果它不能这样做(也许它已经用完了备用池?),那么它就会变成 offline_uncorrectable 并且试图读取或写入它只是错误。


小智 11

psusi 搞定了。

如果您阅读 seagate.com 上的数据表(白皮书),您将了解 HDD 是如何制造、测试的以及它们是如何工作的。没有完美的硬盘驱动器,从来没有,永远不会,(历史和事实)。在过去,我们必须从新驱动器盒中的纸上列表中将坏扇区输入到硬盘控制器中,因此控制器会跳过它们。

现代驱动器具有纠错功能。从第 1 天开始,行业就很糟糕。

所以他们将它们映射出来,这意味着驱动器会跳过坏扇区。事实上,它们是“逻辑交换出来的”——坏扇区被映射到一个新的、好的、备用的柱面扇区(它有备用柱面——把柱面看作轨道)。这一切对外界都是透明的——除了 SMART util。

每个制造商都可以为所欲为,因此有些制造商将错误计数设置为零,即使驱动器一制造就可能有 10 个坏扇区。

驱动器的固件中有 3 次规则 - 它读取一个扇区 3 次,如果所有 3 次都是坏的,那么它可能会动态进行“重新校准”,然后再读取 3 次。如果驱动器仍然不正常,它将将该扇区映射到备用扇区之一。这在固件深处,但在后台不断发生,对用户来说都是透明的。

制造商是否选择在出现 3 个错误读数时或在校准后报告原始错误取决于他们。所以就像他上面说的那样,除非您有许多相同类型的驱动器并且看到一些奇怪的趋势,否则这并不重要。

第 2 点:所有硬盘都有自然读取错误,如果您愿意,您也可以在希捷学习。但他们都有错误。并再次读取,通常通过CRC错误测试。如果不是,驱动器会尝试将其换出。如果你运行磁盘很冷,它会持续很长时间,而且你永远不会用完备用柱面。但请按照 psusi 告诉您的那样看!

我正在一台旧 PC 上打字,它运行着有史以来最早的 1GB 硬盘之一。而且还是不错的。(我支持)(从来没有缺乏冷却......)热量是#1杀手和电源浪涌,我运行UPS。欢呼和美好的一天。我希望这有帮助。(有没有见过 DataA General 硬盘崩溃?然后用大量的铝毛和卷曲提示填满房间?那时候很有趣……从来没有沉闷的时刻……