如何防止 smartclt 报告的不安全关机?

Tsu*_*oku 5 ssd smartctl

根据eblock 的建议smartctl,我在过去几天运行了几次来检查问题。作为示例,下面是输出sudo smartctl -a /dev/nvme0n1p2

\n
smartctl 7.0 2019-05-21 r4917 [x86_64-linux-5.5.7-1-default] (SUSE RPM)\nCopyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org\n\n=== START OF INFORMATION SECTION ===\nModel Number:                       Samsung SSD 970 EVO Plus 500GB\nSerial Number:                      S4EVNZFN503427W\nFirmware Version:                   2B2QEXM7\nPCI Vendor/Subsystem ID:            0x144d\nIEEE OUI Identifier:                0x002538\nTotal NVM Capacity:                 500,107,862,016 [500 GB]\nUnallocated NVM Capacity:           0\nController ID:                      4\nNumber of Namespaces:               1\nNamespace 1 Size/Capacity:          500,107,862,016 [500 GB]\nNamespace 1 Utilization:            94,943,219,712 [94.9 GB]\nNamespace 1 Formatted LBA Size:     512\nNamespace 1 IEEE EUI-64:            002538 5501ad2a18\nLocal Time is:                      Wed Dec  2 11:19:04 2020 CET\nFirmware Updates (0x16):            3 Slots, no Reset required\nOptional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test\nOptional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp\nMaximum Data Transfer Size:         512 Pages\nWarning  Comp. Temp. Threshold:     85 Celsius\nCritical Comp. Temp. Threshold:     85 Celsius\n\nSupported Power States\nSt Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat\n 0 +     7.80W       -        -    0  0  0  0        0       0\n 1 +     6.00W       -        -    1  1  1  1        0       0\n 2 +     3.40W       -        -    2  2  2  2        0       0\n 3 -   0.0700W       -        -    3  3  3  3      210    1200\n 4 -   0.0100W       -        -    4  4  4  4     2000    8000\n\nSupported LBA Sizes (NSID 0x1)\nId Fmt  Data  Metadt  Rel_Perf\n 0 +     512       0         0\n\n=== START OF SMART DATA SECTION ===\nSMART overall-health self-assessment test result: PASSED\n\nSMART/Health Information (NVMe Log 0x02)\nCritical Warning:                   0x00\nTemperature:                        38 Celsius\nAvailable Spare:                    100%\nAvailable Spare Threshold:          10%\nPercentage Used:                    0%\nData Units Read:                    382,321 [195 GB]\nData Units Written:                 695,579 [356 GB]\nHost Read Commands:                 4,525,857\nHost Write Commands:                9,680,786\nController Busy Time:               30\nPower Cycles:                       205\nPower On Hours:                     75\nUnsafe Shutdowns:                   73\nMedia and Data Integrity Errors:    0\nError Information Log Entries:      209\nWarning  Comp. Temperature Time:    0\nCritical Comp. Temperature Time:    0\nTemperature Sensor 1:               38 Celsius\nTemperature Sensor 2:               41 Celsius\n\nError Information (NVMe Log 0x01, max 64 entries)\nNo Errors Logged\n
Run Code Online (Sandbox Code Playgroud)\n

“SMART 整体健康自我评估测试结果:通过”和“未记录错误”这两行看起来令人放心,但以下行却不然:

\n
Unsafe Shutdowns:                   73\n
Run Code Online (Sandbox Code Playgroud)\n

根据Peter Zaitsev 的《使用 NVMe 命令行工具检查 NVMe 闪存运行状况》(2017 年 2 月),不安全关机是指

\n
\n

在未发送关机通知的情况下发生断电的次数。根据您使用的 NVMe 设备\xe2\x80\x99,不安全关闭可能会损坏用户数据。

\n
\n

我的 Tuxedo 笔记本电脑出现过几次意外关机(请参阅是否有方法通过检查日志文件找到意外关机的原因?),但次数不是 73 次。

\n

根据Tom\'s Harware(2019 年 4 月)上的此论坛帖子,禁用快速启动可能会有所帮助。这是正确的还是还需要其他东西?

\n

Art*_*nov 0

由于某些原因,我不相信这个 SMART 参数是正确的。以我自己的 SSD 为例,我看到:

174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       75
Run Code Online (Sandbox Code Playgroud)

这显然是错误的,因为在该 SSD 的使用寿命内,我按下重置按钮或断电的次数不到 20 次。

之所以应该相对安全,是因为在关闭之前,systemd告诉内核刷新缓冲区,因此所有脏缓存实际上都转储到设备上。

只是永远不要忘记定期进行正确的备份 - 这是最重要的事情。