增加 NVMe SSD 上的“错误日志条目数”

Inc*_*rsi 3 linux laptop ssd smart nvme

我笔记本电脑上的 smartd(8) 提醒我 /dev/nvme0 上的 \xe2\x80\x9c 错误日志条目\xe2\x80\x9d 数量每天增加约 8 个。\n的输出如下所示smartctl -a /dev/nvme0

\n
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-6.4.0-060400rc4-generic] (local build)\nCopyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org\n\n=== START OF INFORMATION SECTION ===\nModel Number:                       SAMSUNG MZVLB1T0HBLR-000L2\nSerial Number:                      S4DZNX0R997671\nFirmware Version:                   3L1QEXF7\nPCI Vendor/Subsystem ID:            0x144d\nIEEE OUI Identifier:                0x002538\nTotal NVM Capacity:                 1,024,209,543,168 [1.02 TB]\nUnallocated NVM Capacity:           0\nController ID:                      4\nNVMe Version:                       1.3\nNumber of Namespaces:               1\nNamespace 1 Size/Capacity:          1,024,209,543,168 [1.02 TB]\nNamespace 1 Utilization:            207,072,522,240 [207 GB]\nNamespace 1 Formatted LBA Size:     512\nNamespace 1 IEEE EUI-64:            002538 8911b6e186\nLocal Time is:                      Thu Jun 15 10:12:23 2023 MSK\nFirmware Updates (0x16):            3 Slots, no Reset required\nOptional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test\nOptional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp\nLog Page Attributes (0x03):         S/H_per_NS Cmd_Eff_Lg\nMaximum Data Transfer Size:         512 Pages\nWarning  Comp. Temp. Threshold:     84 Celsius\nCritical Comp. Temp. Threshold:     85 Celsius\n\nSupported Power States\nSt Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat\n 0 +     8.00W       -        -    0  0  0  0        0       0\n 1 +     6.30W       -        -    1  1  1  1        0       0\n 2 +     3.50W       -        -    2  2  2  2        0       0\n 3 -   0.0760W       -        -    3  3  3  3      210    1200\n 4 -   0.0050W       -        -    4  4  4  4     2000    8000\n\nSupported LBA Sizes (NSID 0x1)\nId Fmt  Data  Metadt  Rel_Perf\n 0 +     512       0         0\n\n=== START OF SMART DATA SECTION ===\nSMART overall-health self-assessment test result: PASSED\n\nSMART/Health Information (NVMe Log 0x02)\nCritical Warning:                   0x00\nTemperature:                        50 Celsius\nAvailable Spare:                    100%\nAvailable Spare Threshold:          10%\nPercentage Used:                    0%\nData Units Read:                    57,117,910 [29.2 TB]\nData Units Written:                 4,531,539 [2.32 TB]\nHost Read Commands:                 754,410,384\nHost Write Commands:                127,604,849\nController Busy Time:               1,014\nPower Cycles:                       1,123\nPower On Hours:                     450\nUnsafe Shutdowns:                   139\nMedia and Data Integrity Errors:    0\nError Information Log Entries:      1,236\nWarning  Comp. Temperature Time:    0\nCritical Comp. Temperature Time:    0\nTemperature Sensor 1:               50 Celsius\nTemperature Sensor 2:               47 Celsius\nThermal Temp. 1 Transition Count:   27\nThermal Temp. 1 Total Time:         1121\n\nError Information (NVMe Log 0x01, 16 of 64 entries)\nNum   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS\n  0       1236     0  0x8009  0x4004      -            0     0     -\n
Run Code Online (Sandbox Code Playgroud)\n

\xc4\xaa\xcc\xb2在系统日志中没有发现其他警报(沿着该帖子或类似方式);特别是没有明显的写入(或读取)错误等。但这种烦恼并不常见,因为笔记本电脑自 2022 年 4 月以来一直在工作,而过去 30 天内错误数量从 988 增加到 1236。

\n

鉴于 SSD 存储了一些有价值的数据,\xc4\xaa\xcc\xb2 是否有任何严重的理由值得关注?如果不是现在,那么哪个错误率应该让我感到震惊?这是 Lenovo IdeaPad 5 Pro(请参阅此处的完整硬件信息)。

\n

Joe*_*een 5

通常,您可以忽略错误日志条目,例如,它可能是由于主机向 NVMe 驱动器发送非 NVMe 命令而导致的“错误”。

突然增加可能是某些(监控?)软件的结果,例如您开始使用的向 NVMe 驱动器发送查询的软件。可以肯定的是,了解错误日志条目的内容的唯一方法是查看其中的内容。

我不知道如何使用其他工具来完成此操作。如果您有Windows系统,可以尝试安装HD Sentinel,选择NVMe驱动器>单击磁盘菜单>设备特定信息。然后,您将能够读取 NVMe e 错误日志。

在此输入图像描述

编辑:请参阅https://www.smartmontools.org/ticket/1300了解更多建议以查看实际日志条目:

sudo nvme error-log /dev/nvme0
Run Code Online (Sandbox Code Playgroud)