标签: smart

如何让 smartd 关闭某个特定的离线不可纠正扇区?

我在两盘软件 RAID-1 中有一个磁盘,最近在 SMART 状态下出现了“离线不可纠正扇区”。

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1
Run Code Online (Sandbox Code Playgroud)

如果它越来越频繁地发生,这显然只是磁盘即将发生故障的迹象(并且由于驱动器是镜像的,因此实际数据丢失的风险也不大)。当时,自检在某些时候也失败了,并向smartd我发送了一封电子邮件以通知我这当然应该这样做。

但是,写入损坏的扇区通常会导致磁盘使用其备用扇区之一,而这显然是因为自从我检查dd了磁盘后,所有自检都运行得很好。而且badblocks还发现没有理由抱怨。

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368
Run Code Online (Sandbox Code Playgroud)

故障扇区的数量并没有减少,但实际上不应该减少,因为损坏的扇区仍然存在,尽管未使用。然而,smartd每天晚上继续给我发电子邮件:

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
Run Code Online (Sandbox Code Playgroud)

这显然非常烦人,并且麻木了我对 …

hard-drive smart hardware-failure bad-blocks

21
推荐指数
1
解决办法
8361
查看次数

SMART-Test 永远不会结束

使用 smartmontools 运行 SMART-Tests 时,它们永远不会完成。我总是在各种不同的系统和磁盘上遇到“中断(主机重置。)”,包括 x86 和 ARM 中的 Debian、x64 上的 OS X,以及外部和内部驱动器。即使在磁盘全部为空的俘虏模式下运行(用 dd 清零)。

我究竟做错了什么?

hard-drive maintenance smart

20
推荐指数
3
解决办法
1万
查看次数

尝试删除/诊断 SMART 数据中的单个 Current_Pending_Sector

我正在执行全新的 Linux 安装,在我开始安装之前,我认为现在是验证 HDD 健康状况的好时机,因为如果需要,我可以安全地覆盖 HDD 上的任何数据。

首先,我尝试使用 smartmontools 检查...我的 Seagate HDD 报告一个当前待处理的扇区和一个无法更正的离线扇区(大概是同一个)。重新分配的扇区数为零。

5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
...
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       1
Run Code Online (Sandbox Code Playgroud)

然而,SMART 自测(短、长、离线、传输)没有发现错误。

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      6631         -
# 2  Conveyance offline  Completed without error       00%      6630         -
# …
Run Code Online (Sandbox Code Playgroud)

linux hard-drive smart bad-sectors bad-blocks

19
推荐指数
2
解决办法
1万
查看次数

使用 RAID 和 Intel Matrix Storage 时如何访问 SMART 值?

我们有一个使用英特尔矩阵存储(即基于主板的 RAID)的 RAID 5 阵列。其中一个硬盘开始发出磨擦声,目前正在重建阵列。

我们想询问 Seagate 硬盘上的 SMART 值,但由于某种原因,我们尝试过的所有程序都无法读取 SMART 值。

是否有任何技术可以读取 SMART 值,以便我们可以判断哪个驱动器处于最后阶段?

hard-drive smart

18
推荐指数
3
解决办法
5万
查看次数

我应该如何理解 CrystalDiskInfo 报告中的“当前挂起扇区数”?

我的 USB 磁盘不断显示(在每次检查磁盘通过后)不断通知我添加到坏簇文件中的新簇:

在此处输入图片说明

但它没有在磁盘摘要中将它们列为“损坏的扇区”:

在此处输入图片说明

因此我不是 100% 确定,这是正常情况还是我的磁盘出现故障。我浏览了这个这个问题和答案,但没有找到可靠的答案,因为他们都在询问已经在摘要中列为损坏的扇区。

因此,在阅读这篇文章后,我下载了CrystalDiskInfo 6.7.5 x64 的便携式版本,然后……要么我很笨,要么我完全不明白它给我带来的结果。

我可以看到,我的磁盘导致“警告”健康状态,但真正让我感到惊讶的是......

在此处输入图片说明

...该程序分析的几乎每个参数都高于阈值,但只有一个用黄色标记以引起我的注意。

我错过了什么或者我应该如何阅读 CrystalDiskInfo 报告?为什么其他 SMART 参数没有标记为警告/危险/警告,它们也高于阈值?

hard-drive check-disk smart

15
推荐指数
1
解决办法
4万
查看次数

戴尔消息称我的 SSD 硬盘已接近使用寿命,而 CrystalDiskInfo 表示情况良好。我相信谁?

我有一台戴尔 Inspiron 灵越,已经用了快 5 年了。它有一个磁盘,即 256GB SSD。

戴尔的支持协助计划表示我的硬盘出现故障。

在此输入图像描述

OTOH,CrystalDiskInfo 说我的磁盘运行状况良好 在此输入图像描述 我读到,与普通硬盘不同,SSD 会突然发生故障,而不是缓慢发生故障。那么戴尔如何检测我的 SSD 已接近使用寿命。这是基于我的 SSD 已近 5 年历史的消息还是他们检测到了一些问题?我该如何解决这个问题?

为了安全起见,我应该更换 SSD 还是放弃它?


智能信息:

=== START OF INFORMATION SECTION ===
Model Family:     Crucial/Micron Client SSDs
Device Model:     Micron 1100 SATA 256GB
LU WWN Device Id: 5 00a075 11bd0d9b7
Firmware Version: M0DL022
User Capacity:    256,060,514,304 bytes [256 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    Solid State Device
Form Factor:      M.2
TRIM Command:     Available, deterministic, zeroed
Device is:        In smartctl …
Run Code Online (Sandbox Code Playgroud)

ssd hard-drive smart

14
推荐指数
4
解决办法
1万
查看次数

硬盘驱动器诊断工具如何知道一个扇区是否坏了?

当我遇到可能出现故障的硬盘驱动器时,我使用ViVARD对其进行扫描,它可靠地让我知道该驱动器是否需要更换。

这些工具是如何工作的?他们如何区分坏扇区和好扇区?

hard-drive smart hardware-failure

13
推荐指数
2
解决办法
1248
查看次数

如何测试 SSD 或 NVMe 的坏块?

使用传统的旋转磁盘诊断相当容易。如果您怀疑驱动器有故障,您可以检查 SMART 值,运行 SMART 扩展测试和badblocks -wsv测试。如果所有三个测试都没有显示错误,则驱动器可能/通常没问题。

对于 SSD 或现代 NVMe 驱动器,我们应该怎么做?

显然,SMART 仍然是一个好主意,但如果它没有错误地完成呢?badblocks -wsv在基于闪存的存储设备上运行是个好主意吗?

还有其他选择吗?

另外,如果使用badblocks什么选项是合适的?应该使用SSD的“擦除块大小”吗?


这个问题类似于我能证明固态硬盘坏了吗?但答案是从 2013 年开始的。从那时起,我们已经看到了几代闪存技术。- 另外,虽然他们建议badblocks,但我错过了关于天气的讨论,这是一个好主意。最后,有些闪存不喜欢将其写入 100%。另外,之后我们如何告诉 SSD 哪些扇区是空闲的(再次)?

如何修复SSD上的坏块也不令人满意。

在 SSD 上运行 CHKDSK 有多安全?只讨论影响chkdsk

我找不到处理这个问题的其他资源。

ssd smart bad-blocks

13
推荐指数
1
解决办法
1万
查看次数

硬盘坏道

我经常在硬盘上运行检查磁盘,最近有人说我有一些坏扇区(确切地说是 66 个)。我已经运行过 smartctl 和 HD Tune。两者都告诉我我有坏扇区并且驱动器处于“故障前”阶段。该驱动器只有几年的历史。我应该有多担心?

我的驱动器是富士通 MHW2160BJ FFS G2

windows-7 hard-drive smart bad-sectors chkdsk

12
推荐指数
2
解决办法
2211
查看次数

我的硬盘驱动器理论上可以承受多少“Load_cycle_count”?

我正在使用 SMART 检查我的硬盘驱动器,我最近购买了一个二手 WD Caviar Blue 2.5",我注意到 Load_Cycle_Count 已经超过了 300k 大关,这是西部数据公司表示可以承受的最大值。

所以我想知道,到目前为止,驱动器工作正常,除了我使用 Ubuntu 时,由于日志和其他东西,它正在极快地增加 Load_Cycle_Count。到目前为止,我还没有找到问题的解决方案,我期待着刷新硬盘驱动器并将加载/卸载空闲时间从 5 秒更改为 300 秒,我目前找到的解决方案是继续播种我的种子。这是一个好主意吗?

无论如何,如果我继续使用我的新笔记本电脑的硬盘驱动器,假设它可以承受多少,而不会过多地关闭机器和播种种子?

linux hard-drive smart lifespan

12
推荐指数
2
解决办法
2万
查看次数