Ubuntu 22.04.1 随机冻结

fie*_*lug 5 hardware freeze 20.04 22.04

所以我在一个相当新的桌面上运行 Ubuntu 22.04.1(规格如下)。自安装以来,总会出现一些轻微的冻结情况,但没有什么是无法通过重新启动或重新安装 Nvidia 驱动程序来解决的。然而,几天前,当我在它平稳运行一周多后将其关闭时,问题升级了。目前它已经变得几乎无法使用;桌面会随机冻结,有时是在重新启动后立即冻结,有时是几个小时后。发生这种情况时,系统完全没有响应。

应该注意的是,在关闭之前(由于后台进程占用了太多 RAM 和交换空间),我已经运行了swapoff,但在它完成之前中断了它。我不确定这是否会导致我现在所经历的情况。

到目前为止我尝试过的事情

  • 发生这种情况后,我通读了/var/log/syslog几次,没有发现什么特别的地方,因为每次看起来都有点不同,并且没有显示明显的错误消息。

  • SysRq 键从未起作用。

  • 我尝试在空 SSD(之后nvme format)和 HDD 上重新安装 Ubuntu 22.04.1,但都没有帮助。

  • 除了HDD 上的 3 个错误之外,smartctl和实用程序nvme不会报告任何严重的磁盘错误。UNC

  • 禁用iommu没有任何影响。

  • memtester测试 30 GB RAM 时未报告任何错误。

  • 当发生冻结时,free -msensorstop、 或nvidia-smi(当我安装了驱动程序时)没有显示任何异常活动(温度较低等)。即使仅使用默认 GPU 驱动程序 ( ),问题仍然存在nouveau

  • 起初从实时 USB 启动相对稳定,但现在也会发生同样的情况。我已经尝试过 22.04.1 和 20.04.5 了。

  • 完全卸下显卡不会改变任何东西。

  • 这可能有关系,拆下CPU散热器后我发现散热器和处理器之间有一层应该拆掉的塑料膜(PC是当地五金店组装的),所以基本上CPU已经运行了将近一年没有适当的冷却。在此之前,BIOS 中报告的CPU 温度始终保持在 ~90 C。移除后,温度显着下降(降至约 40°C),但有关冷冻的情况似乎没有改变。

眼镜

主板:华硕 TUF Gaming H670-Pro Wifi D4

处理器:英特尔 i9-12900K

GPU:RTX-3070Ti(制造商索泰)

内存:16GB x 2 DDR4 2667 MHz (XPG)

贮存:

  • 西数黑色 SN750 SE 1TB 固态硬盘
  • 希捷梭子鱼 2TB 硬盘

我相信这是一个硬件问题,但我不确定诊断问题的下一步可能是什么。任何想法或评论表示赞赏。

Pro*_*ter 2

关于硬件问题,我刚刚查了一下,你的CPU最高温度在100\xc2\xb0C左右。所以理论上不应该有物理损坏,但考虑到它在使用一年的时间里一直保持在 90\xc2\xb0C - 我不会忽视硬件损坏的可能性。

\n

在您尝试过之后,我唯一的猜测是问题出在 Wayland(如果您正在使用它)。因此,如果您使用 Wayland,请通过在登录屏幕上选择您的用户并单击右下角的齿轮图标来切换到 XOrg。选择 XOrg。

\n

另外,冻结期是多长时间?如果时间很短,请尝试Full composition pipeline在 Nvidia 设置中启用。我相信它位于“显示”或类似的位置。转到高级选项。在那里,启用完整的组合管道并保存到 X 配置文件(为此,您需要从终端以 sudo 身份运行应用程序)。这并没有真正帮助我,但我听说它应该有助于解决屏幕撕裂和轻微的冻结,所以如果冻结不严重,你应该尝试一下。

\n