出于某种原因,我要重新映射的待处理扇区数高得令人难以置信(目前为 2163)。我看到它在一周内上涨了 20。但是没有重新映射任何扇区。戴尔的计算机诊断实用程序报告没有问题,smartctl -H 返回 PASSED,我还没有注意到硬盘驱动器有任何问题。
那么我需要担心如此高的待处理计数吗?
以下是结果smartctl -A:
SMART 属性数据结构修订号:16 具有阈值的供应商特定 SMART 属性: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 100 100 051 总是预失败 - 0 3 Spin_Up_Time 0x0007 252 252 025 总是预失败 - 2062 4 Start_Stop_Count 0x0032 097 097 000 Old_age Always - 36147 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 9 Power_On_Hours 0x0032 095 095 000 Old_age Always - 3261 12 Power_Cycle_Count 0x0032 098 098 000 …
我正在尝试调试硬件问题,我的第一个目标是SSD硬盘。然而,该驱动器没有启用 SMART,几乎所有检查 SSD 运行状况的建议都包括使用 SMART 相关工具。
我使用的是华硕 EEE;这是一些信息:
$ smartctl -i /dev/sda
smartctl 5.43 2012-06-30 r3573 [i686-linux-3.5.4-1-ARCH] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Model Family: Asus-Phison SSD
Device Model: ASUS-PHISON SSD
Serial Number:
Firmware Version: TST2.04U
User Capacity: 8,069,677,056 bytes [8.06 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 5
ATA Standard is: Exact ATA specification draft version not indicated …Run Code Online (Sandbox Code Playgroud) 我已经更换了硬盘,现在我的电脑每 1 到 5 分钟就会冻结 5 到 10 秒。实际上,只有活动的应用程序会冻结(但它可以是任何应用程序),通常是当我单击某些内容时,但有时会自动冻结。
如何检查这是硬盘问题还是软件问题?
我不想立即将我的笔记本电脑送去更换硬盘驱动器,因为上次服务需要 40 天,所以我正在寻找一种可以确认这是硬盘驱动器问题的工具。
我有一个通过 USB 连接的 Western Digital Elements Desktop 硬盘。基本上,它是 WD30EZRX 驱动器的美化包。我用它来保存系统备份(现在是旧的),所以没有什么重要的。我现在可能可以擦掉它然后扔掉它而不会错过任何东西。
几个月前,我用一个不同的驱动器有效地替换了上述驱动器,但我一直保留着这个旧驱动器(部分原因是我需要参考某个文件的旧版本,部分原因是我打算转换它到异地备份驱动器)。已连接并通电,但未使用;文件系统尚未安装,因此它应该看到的唯一活动是启动时的分区表扫描,并且 ZFS 可能会查看几次以查看其上是否有属于池的任何分区。
此外,大约一个月前,我设置了 smartd 来监控连接到我的系统的各种磁盘的健康状况。它立即对这个驱动器报告了一个挂起(不可读)扇区数为 5 的血腥谋杀。知道挂起扇区本身是可管理的,我保持驱动器连接但未使用。
今天下午smartd的邮件报告突然显示有6个pending扇区,还有1个离线不可修复扇区(这是新的)。
这是奇怪的部分:最近一次重新启动,因此驱动器最近应该看到任何活动,几乎是四天前。
该驱动器在逻辑上包含一个跨越整个磁盘的分区,该分区包含一个 LUKS 容器,自从我设置 smartd 来监视驱动器的健康状况以来,该容器尚未启动。它从未成为任何级别(驱动器、分区、LUKS 容器、包含的文件系统)的任何 RAID 阵列或类似物的一部分。
检查smartctl --all驱动器报告未记录自检。这也证实了待处理扇区数为 6 以及离线不可纠正数为 1。
当驱动器甚至不应该看到任何活动时,什么可能导致挂起扇区和脱机不可纠正扇区数增加?
注意:我不是在问我是否应该继续使用这个驱动器。在这一点上它显然变得不可靠了,将被淘汰;我因硬盘驱动器崩溃而遭受数据丢失的次数太多,无法对我的数据进行任何真正的尝试。
我全新的“WDC WD10EZRX”1TB 绿色硬盘,SMART 日志显示非常高的负载周期数,并且它一直在高速增长。

我该怎么办 ?
编辑:
最后,我鼓起勇气尝试了“WDIDLE3”工具,它对我有用。我检查了默认空闲时间设置为 12 秒,我将其更改为 300 秒(5 分钟)。到目前为止,一切似乎都很好。
我只是想知道为什么 smartctl(“用户容量”)显示的驱动器大小与 fdisk -l、dmesg、hdparm 显示的值不同,并且与数据表中的驱动器规格值不同。我需要一些提示来解释这些值。
首先我做了一个
dd_rescue /dev/zero /dev/sdf
Run Code Online (Sandbox Code Playgroud)
直到 dd_rescue 因“设备上没有剩余空间”而中断。
传输量为 3000558944256 字节。它类似于 fdisk -l 和 dmesg 字节数。
smartctl -x 说:
=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar Green (Adv. Format)
(...)
Firmware Version: 80.00A80
User Capacity: 3.000.559.428.096 bytes [3,00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ACS-2 (revision not indicated)
Local Time is: Thu …Run Code Online (Sandbox Code Playgroud) 我对Spin Retry Count SMART 属性值感到困惑。
在一个特定的硬盘上,我看到原始值为0,流行的 CrystalDiskInfo v7.0.5 将其解释为当前值为166,最差值为100,阈值为 30。
根据维基百科:
“这个属性值的增加是硬盘机械子系统出现问题的迹象。”
根据ActiveSmart(由 Ariolic Software 提供)文档:
“这个属性值的下降是硬盘机械子系统出现问题的征兆。”
问题:
好的,是哪个?
为什么 CrystalDiskInfo 将原始值 0 解释为当前值 166?
我一直认为该属性的原始值为 0 表示驱动器从未重试旋转启动。那是对的吗?
我的 SATA SSD 在大约 2 年的时间里出现了超过 37K CRC 错误。这些并没有线性增加。只有 3 -4 次 Windows 挂起,后来在检查 SMART 参数后,我发现 CRC 错误计数大幅增加。一次增加 7 – 8K 是突然的。SSD 否则正常运行。
我想知道这种行为的原因是什么。我有优质的 SATA 电缆,它们在机柜中没有过度弯曲或扭曲。
此外,这个问题似乎是自限性的。无需接触任何东西(无需重新安装 SATA 电缆等),它会自行恢复,然后再正常工作几个月,然后才会出现这种零星行为。
这让我想知道 SSD 本身是否有可能导致这种情况?
我有另一个硬盘连接到同一个 SATA 控制器,到目前为止它从未表现出这样的行为。
系统配置 - 主板 880GM USB3、SATA II、AMD SB710 芯片组、Windows 7 64、8GB RAM、三星 EVO 850 120GB SSD、希捷 Barracuda 2.5 硬盘。
三星便携式 SSD T7 似乎不能很好地与 Linux 工具配合使用。该驱动器已被操作系统识别,基本功能运行良好。
但是,hdparm不会报告有关驱动器的任何信息:
SG_IO: bad/missing sense data, sb[]: 70 00 05 00 00 00 00 0a 00 00 00 00 20 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
两者都不会smartctl:/dev/sda: Unknown USB bridge [0x04e8:0x4001 (0x100)]
只有当我按照建议指定设备类型时,它才会显示一些内容,但输出不完整,我看不到任何 SMART 值:
# smartctl -a -d scsi /dev/sda
smartctl 7.2 2021-01-17 r5171 [x86_64-linux-5.11.14-100.fc32.x86_64] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org
=== …Run Code Online (Sandbox Code Playgroud) 我有购买二手 HGST HUS724020ALA640 的报价。卖家发送了使用 CrystalDiskInfo 制作的 SMART 参数的屏幕截图。我已经检查了这些参数,它们处于参考状态(或接近参考状态),除了旋转时间的原始值:
| ID | 属性名称 | 当前的 | 最差 | 临界点 | 原始值 |
|---|---|---|---|---|---|
| 03 | 自旋时间 | 126 | 126 | 24 | 00A011EE01F0 |
附加信息
该硬盘生产于2016年,运行时间为45,321小时,通电次数为29次(服务器使用情况)。
问题
根据SMART 属性:旋转时间定义为:
旋转时间 SMART 参数指示主轴旋转(从零 RPM(每分钟转数)到完全运行)的平均时间(以毫秒或秒为单位)。
但是,值 00A011EE01F0(十进制为 687495578096)太大,无法作为秒数或毫秒数。
旋转时间的原始值实际上意味着什么?
smart ×10
hard-drive ×9
ssd ×3
crc ×1
diagnostic ×1
linux ×1
samsung-ssd ×1
sata ×1
sectors ×1
security ×1
windows ×1