首先,我想每个人都知道硬盘驱动器出现故障的次数比制造商愿意承认的要多得多。谷歌做了一项研究,表明硬盘驱动器的 SMART 状态报告的某些原始数据属性可能与驱动器未来的故障有很强的相关性。
例如,我们发现,在第一次扫描错误后,驱动器在 60 天内发生故障的可能性是没有此类错误的驱动器的 39 倍。重新分配、离线重新分配和试用计数中的第一个错误也与更高的故障概率密切相关。尽管存在这些强相关性,我们发现仅基于 SMART 参数的故障预测模型的预测准确性可能会受到严重限制,因为我们的大部分故障驱动器都没有显示出任何 SMART 错误信号。
希捷似乎试图掩盖有关其驱动器的这些信息,声称只有他们的软件才能准确确定其驱动器的准确状态,而且他们的软件不会告诉您 SMART 属性的原始数据值。据我所知,Western Digital 没有做出这样的声明,但他们的状态报告工具似乎也没有报告原始数据值。
我一直在使用 smartmontools 的 HDtune 和 smartctl 来收集每个属性的原始数据值。我发现确实如此......当涉及到某些属性时,我将苹果与橙子进行了比较。例如,我发现大多数希捷硬盘会报告它们有数百万个读取错误,而西部数据 99% 的时间显示读取错误为 0。我还发现希捷会报告数百万个搜索错误,而西部数据似乎总是报告 0。
问:如何标准化这些数据?希捷是否会产生数百万个错误,而西部数据则没有产生任何错误?维基百科关于SMART状态的文章说制造商有不同的报告这些数据的方式。
这是我的假设:
我想我找到了一种方法来规范化(这是正确的术语吗?)数据。
希捷硬盘有一个西部数据硬盘没有的附加属性(硬件 ECC 恢复)。当您从 ECC 恢复计数中减去读取错误计数时,您可能会得到 0。这似乎相当于 Western Digital 报告的“读取错误”计数。这意味着 Western Digital 只报告它无法纠正的读取错误,而 Seagate 会计算所有读取错误并告诉您它能够修复的错误数量。
我有一个 Seagate 驱动器,其中读取错误计数小于 ECC 恢复计数,我注意到我的许多文件都已损坏。这就是我提出我的假设的方式。希捷产生的数以百万计的搜索错误对我来说仍然是个谜。
如果您有其他信息,请确认或更正我的假设。
这是我的西部数字驱动器的智能状态,以便您了解我在说什么:
james@ubuntu:~$ sudo smartctl -a /dev/sda
smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== …
Run Code Online (Sandbox Code Playgroud)