根据eblock 的建议smartctl
,我在过去几天运行了几次来检查问题。作为示例,下面是输出sudo smartctl -a /dev/nvme0n1p2
:
smartctl 7.0 2019-05-21 r4917 [x86_64-linux-5.5.7-1-default] (SUSE RPM)\nCopyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org\n\n=== START OF INFORMATION SECTION ===\nModel Number: Samsung SSD 970 EVO Plus 500GB\nSerial Number: S4EVNZFN503427W\nFirmware Version: 2B2QEXM7\nPCI Vendor/Subsystem ID: 0x144d\nIEEE OUI Identifier: 0x002538\nTotal NVM Capacity: 500,107,862,016 [500 GB]\nUnallocated NVM Capacity: 0\nController ID: 4\nNumber of Namespaces: 1\nNamespace 1 Size/Capacity: 500,107,862,016 [500 GB]\nNamespace 1 Utilization: 94,943,219,712 [94.9 GB]\nNamespace 1 Formatted LBA Size: 512\nNamespace 1 IEEE EUI-64: 002538 5501ad2a18\nLocal Time is: Wed Dec 2 11:19:04 2020 CET\nFirmware Updates (0x16): 3 Slots, no Reset required\nOptional Admin Commands (0x0017): Security Format Frmw_DL Self_Test\nOptional NVM Commands (0x005f): Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp\nMaximum Data Transfer Size: 512 Pages\nWarning Comp. Temp. Threshold: 85 Celsius\nCritical Comp. Temp. Threshold: 85 Celsius\n\nSupported Power States\nSt Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat\n 0 + 7.80W - - 0 0 0 0 0 0\n 1 + 6.00W - - 1 1 1 1 0 0\n 2 + 3.40W - - 2 2 2 2 0 0\n 3 - 0.0700W - - 3 3 3 3 210 1200\n 4 - 0.0100W - - 4 4 4 4 2000 8000\n\nSupported LBA Sizes (NSID 0x1)\nId Fmt Data Metadt Rel_Perf\n 0 + 512 0 0\n\n=== START OF SMART DATA SECTION ===\nSMART overall-health self-assessment test result: PASSED\n\nSMART/Health Information (NVMe Log 0x02)\nCritical Warning: 0x00\nTemperature: 38 Celsius\nAvailable Spare: 100%\nAvailable Spare Threshold: 10%\nPercentage Used: 0%\nData Units Read: 382,321 [195 GB]\nData Units Written: 695,579 [356 GB]\nHost Read Commands: 4,525,857\nHost Write Commands: 9,680,786\nController Busy Time: 30\nPower Cycles: 205\nPower On Hours: 75\nUnsafe Shutdowns: 73\nMedia and Data Integrity Errors: 0\nError Information Log Entries: 209\nWarning Comp. Temperature Time: 0\nCritical Comp. Temperature Time: 0\nTemperature Sensor 1: 38 Celsius\nTemperature Sensor 2: 41 Celsius\n\nError Information (NVMe Log 0x01, max 64 entries)\nNo Errors Logged\n
Run Code Online (Sandbox Code Playgroud)\n“SMART 整体健康自我评估测试结果:通过”和“未记录错误”这两行看起来令人放心,但以下行却不然:
\nUnsafe Shutdowns: 73\n
Run Code Online (Sandbox Code Playgroud)\n根据Peter Zaitsev 的《使用 NVMe 命令行工具检查 NVMe 闪存运行状况》(2017 年 2 月),不安全关机是指
\n\n\n在未发送关机通知的情况下发生断电的次数。根据您使用的 NVMe 设备\xe2\x80\x99,不安全关闭可能会损坏用户数据。
\n
我的 Tuxedo 笔记本电脑出现过几次意外关机(请参阅是否有方法通过检查日志文件找到意外关机的原因?),但次数不是 73 次。
\n根据Tom\'s Harware(2019 年 4 月)上的此论坛帖子,禁用快速启动可能会有所帮助。这是正确的还是还需要其他东西?
\n由于某些原因,我不相信这个 SMART 参数是正确的。以我自己的 SSD 为例,我看到:
174 Unexpect_Power_Loss_Ct 0x0032 100 100 000 Old_age Always - 75
Run Code Online (Sandbox Code Playgroud)
这显然是错误的,因为在该 SSD 的使用寿命内,我按下重置按钮或断电的次数不到 20 次。
之所以应该相对安全,是因为在关闭之前,systemd
告诉内核刷新缓冲区,因此所有脏缓存实际上都转储到设备上。
只是永远不要忘记定期进行正确的备份 - 这是最重要的事情。