三星 NVMe SSD 是 18.04 还是 19.04?总线错误

Bre*_*bad 5 upgrade nvme 18.04 19.04

预先:

  • 是否更新了 BIOS(MB:Asus Z390-F
  • 是否更新了 NVMe SSD 固件(三星 970 EVO Plus,500G)
  • 运行memtest86了几个小时(问题发生后:没问题)
  • CPU 为Intel i5-9400,提供超高清显卡 630
  • UEFI 启动
  • 不超频
  • 除了 Wake On LAN (On)、“Download and install Armory Crate”(Off) 外,BIOS 都是“优化的默认值”
  • MB(主板)没有别的(没有CD,没有显卡......)

Ubuntu 安装(SSD 应该专用于 Ubuntu 18.04)

  • 安装了全新的 Ubuntu 18.04.3
  • 选择“安装时更新”+“安装第 3 方驱动程序...”
  • 手动分区,所有 ext4(然后也尝试“擦除磁盘并安装”)
  • ? 安装出现“崩溃”,是“抱歉”和“点击重启”

所以,再试一次,整个过程,没有“安装时更新”和“安装 3rd 方驱动程序......”(删除网络以确保)

  • 这次通过了
  • 然后做了 apt update ; apt upgrade
  • 重启
  • 然后过了一会儿,使用Ubuntu GUI,突然页面和页面

编辑,dmesg摘录:

[  109.632452] pcieport 0000:00:1d.0: AER: Corrected error received: 0000:00:1d.0
[  109.632466] pcieport 0000:00:1d.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
[  109.632474] pcieport 0000:00:1d.0:   device [8086:a330] error status/mask=00000001/00002000
[  109.632479] pcieport 0000:00:1d.0:    [ 0] RxErr                 
[  134.215214] pcieport 0000:00:1d.0: AER: Corrected error received: 0000:00:1d.0
[  134.215219] pcieport 0000:00:1d.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
[  134.215222] pcieport 0000:00:1d.0:   device [8086:a330] error status/mask=00000001/00002000
[  134.215224] pcieport 0000:00:1d.0:    [ 0] RxErr                 
[  144.288685] nvme nvme0: controller is down; will reset: CSTS=0xffffffff, PCI_STATUS=0x10
[  144.320962] print_req_error: I/O error, dev nvme0n1, sector 111572600 flags 80700
[  144.344627] nvme 0000:03:00.0: enabling device (0000 -> 0002)
[  144.344951] nvme nvme0: Removing after probe failure status: -19
[  144.369035] print_req_error: I/O error, dev nvme0n1, sector 127856976 flags 801
[  144.369062] print_req_error: I/O error, dev nvme0n1, sector 332338688 flags 801
[  144.369075] EXT4-fs warning (device nvme0n1p8): ext4_end_bio:323: I/O error 10 writing to inode 16253466 (offset 0 size 233472 starting block 41542393)
[  144.369079] Buffer I/O error on device nvme0n1p8, logical block 70080
[  144.369099] Buffer I/O error on device nvme0n1p8, logical block 70081
[  144.369103] Buffer I/O error on device nvme0n1p8, logical block 70082
[  144.369106] Buffer I/O error on device nvme0n1p8, logical block 70083
[  144.369110] Buffer I/O error on device nvme0n1p8, logical block 70084
[  144.369113] Buffer I/O error on device nvme0n1p8, logical block 70085
[  144.369116] Aborting journal on device nvme0n1p5-8.
[  144.369118] Buffer I/O error on device nvme0n1p8, logical block 70086
[  144.369121] Buffer I/O error on device nvme0n1p8, logical block 70087
[  144.369124] Buffer I/O error on device nvme0n1p8, logical block 70088
[  144.369127] Buffer I/O error on device nvme0n1p8, logical block 70089
[  144.369136] EXT4-fs error (device nvme0n1p5) in ext4_reserve_inode_write:5901: Journal has aborted
[  144.369140] Buffer I/O error on dev nvme0n1p5, logical block 3178496, lost sync page write
[  144.369144] JBD2: Error -5 detected when updating journal superblock for nvme0n1p5-8.
[  144.369164] Buffer I/O error on dev nvme0n1p5, logical block 0, lost sync page write
[  144.369169] EXT4-fs (nvme0n1p5): I/O error while writing superblock
[  144.369173] EXT4-fs (nvme0n1p5): Remounting filesystem read-only
[  144.369245] EXT4-fs warning (device nvme0n1p5): ext4_end_bio:323: I/O error 10 writing to inode 1311005 (offset 0 size 0 starting block 31736)
Run Code Online (Sandbox Code Playgroud)

得到显示。不得不重置电脑。

最初我在看一个坏的 NVMe SSD,但是......

Windows 10 试用安装. 所以我安装了 Windows 10(免费的 ISO)来确认问题是 SSD(三星只支持 Windows)

  • 占用整个磁盘,
  • 创建与 Ubuntu 上一样多的分区
  • MS 更新了吗
  • 对所有分区进行压力测试,一遍遍复制文件,填满分区
  • 重启了很多次
  • ? 任何地方都没有错误,智能日志中没有任何内容(三星魔术师)

因此,似乎很难责怪SSD。

Ubuntu 19.04 安装。然后,在Windows中创建(除了一个其中Windows是)数据分区我安装了Ubuntu 19.04(18.04没有),因此这些部件从去ntfsext4

  • 一切顺利
  • 做过 apt update && apt upgrade
  • 重启
  • 使用 Ubuntu,
  • ? 然后和以前一样,页面和页面与上面相同的消息
  • ? 重新启动:转到 Grub“shell”

引导(从 BIOS)到 Windows 是可以的。Ubuntu 引导进入 grub shell。

不知道下一步该怎么做 ...

  • 可能是 Ubuntu 升级会影响 Grub(由于 NVMe SSD)?
  • 可能是一个坏 SSD,但在这种情况下,为什么 Windows 没有问题?
  • 18.04.3 和 19.04 都使用内核 5.0.x,这可能与问题有关吗?


? 编辑 ?

这似乎 问题 发生很多,而且大多在三星NVMe驱动器。

按照这些页面上的建议,我安装了 Ubuntu(18.04.3,内核 5.0.0.19),将选项添加nvme_core.default_ps_max_latency_us=0到 Grub Linux 启动命令?很好。

然后重新启动,在命令中添加相同的选项?美好的。并确认 APST 已禁用

# nvme get-feature -f 0x0c -H /dev/nvme0

Autonomous Power State Transition Enable (APSTE): Disabled
Run Code Online (Sandbox Code Playgroud)

然后做了(同一个会话)

# apt update
# apt upgrade
Run Code Online (Sandbox Code Playgroud)

几秒钟后......错误消息又回来了,覆盖屏幕,GUI锁定,甚至入侵其他CtrlAlt Fx控制台......(实际上它发生在一段时间后,不仅仅是因为命令是apt

不确定这是 Linux 错误,还是三星忽略了 Linux,但我被卡住了!


(编辑+7h

  • 删除了三星,
  • 插入(SATA)“经典”SSD,
  • 安装了 Ubuntu 19.04,进行了所有更新,做了一个find / -ls和其他命令,使用了图形,重新启动了几次
  • ? 作品!

我的下一步是用明天购买的 SanDisk NVMe 替换三星(在笔记本电脑中使用 Ubuntu 已经有几个月了,完全没问题)

将保持页面更新!

)

GHo*_*rev 2

我通过禁用 ASPM 解决了这个问题。

添加pcie_aspm=off到文件GRUB_CMDLINE_LINUX_DEFAULT/etc/default/grub并运行sudo update-grub


小智 1

我的情况与 intel ssd 660p 系列 512gb 完全相同。

我已经尝试了很多参数nvme_core.default_ps_max_latency_us,很多内核版本等等。