所以我在一个相当新的桌面上运行 Ubuntu 22.04.1(规格如下)。自安装以来,总会出现一些轻微的冻结情况,但没有什么是无法通过重新启动或重新安装 Nvidia 驱动程序来解决的。然而,几天前,当我在它平稳运行一周多后将其关闭时,问题升级了。目前它已经变得几乎无法使用;桌面会随机冻结,有时是在重新启动后立即冻结,有时是几个小时后。发生这种情况时,系统完全没有响应。
应该注意的是,在关闭之前(由于后台进程占用了太多 RAM 和交换空间),我已经运行了swapoff,但在它完成之前中断了它。我不确定这是否会导致我现在所经历的情况。
到目前为止我尝试过的事情
发生这种情况后,我通读了/var/log/syslog几次,没有发现什么特别的地方,因为每次看起来都有点不同,并且没有显示明显的错误消息。
SysRq 键从未起作用。
我尝试在空 SSD(之后nvme format)和 HDD 上重新安装 Ubuntu 22.04.1,但都没有帮助。
除了HDD 上的 3 个错误之外,smartctl和实用程序nvme不会报告任何严重的磁盘错误。UNC
禁用iommu没有任何影响。
memtester测试 30 GB RAM 时未报告任何错误。
当发生冻结时,free -m、sensors、top、 或nvidia-smi(当我安装了驱动程序时)没有显示任何异常活动(温度较低等)。即使仅使用默认 GPU 驱动程序 ( ),问题仍然存在nouveau。
起初从实时 USB 启动相对稳定,但现在也会发生同样的情况。我已经尝试过 22.04.1 和 20.04.5 了。
完全卸下显卡不会改变任何东西。
这可能有关系,拆下CPU散热器后我发现散热器和处理器之间有一层应该拆掉的塑料膜(PC是当地五金店组装的),所以基本上CPU已经运行了将近一年没有适当的冷却。在此之前,BIOS 中报告的CPU 温度始终保持在 ~90 C。移除后,温度显着下降(降至约 40°C),但有关冷冻的情况似乎没有改变。
眼镜
主板:华硕 TUF …