如何忽略特定的 SMART 错误

Sen*_*try 5 unix hard-drive smart

我每天都会收到一封关于相同 SMART 错误的电子邮件。我想配置 SMART 守护程序以忽略此特定错误,但仅限于此,因为如果有任何更改或变得更糟,我现在仍然想要。

This email was generated by the smartd daemon running on:

 host name: jon
DNS domain: [Unknown]
NIS domain: (none)

The following warning/error was logged by the smartd daemon:

Device: /dev/sdb [SAT], 11 Currently unreadable (pending) sectors


For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
The original email about this issue was sent at Sun Nov 25 02:30:45 2012 CET
Another email message will be sent in 24 hours if the problem persists.
Run Code Online (Sandbox Code Playgroud)

第一次发生时,不可读扇区的数量正在缓慢增加,因此进行了备份并尝试了此线程中描述的许多事情:https : //serverfault.com/questions/104417/how-do-i-easily-repair-a -single-unreadable-block-on-a-linux-disk

正如您从电子邮件中看到的那样,这是 1.5 年前的事情,所以我不太记得我尝试过什么,没有尝试过什么。但是,磁盘从那时起一直保持稳定和工作,所以我看不出有任何改变任何东西的理由。(是的,我定期创建备份。)

我只能想到一种解决方法,即忽略包含此确切文本的所有邮件,但这只会治疗症状,而不是原因。

编辑:

我知道你们中的许多人或大多数人会给我“更换磁盘”的建议,这通常是解决诸如“我收到此错误,我该怎么办?”之类的问题的最佳建议。

但是,接受我知道风险并询问有关 SMART 守护程序的非常具体的问题。我没有在文档中找到任何表明可以做我想做的事情的内容,但我想在使用我的解决方法之前先在这里仔细检查一下。

更新:

大约一周前,计数器再次下降到 1。我不知道是什么原因造成的,我没有在那台机器上做任何维护工作。时隔2年多,11个板块又恢复了正常。这真的很奇怪。

小智 6

您需要更改配置/etc/smartd.conf

向您的设置添加参数:

-t -I 197  
Run Code Online (Sandbox Code Playgroud)

它忽略属性 197 - 待处理扇区

像这样(示例):

/dev/ad0 -H -l error -l selftest -t -I 197
Run Code Online (Sandbox Code Playgroud)


小智 1

嗯...我不知道如何重新配置​​ smartd,但我现在可以让 OMD[1] 忽略某些 SMART 错误(我曾经使用稳定的重新分配扇区数执行此操作)。如果您想监控盒子的更多参数而不仅仅是 SMART 读数,也许这也是您的一个选择。