华硕P53E 3.6.8内核无法追踪的稳定性问题

Ada*_*ski 7 kernel-panic linux-mint freeze

随机,但不迟于工作 10 小时后,笔记本电脑冻结。只是冻结。知道并非所有硬件错误都会报告给用户,因此我尝试了 netconsole。不幸的是,netconsole 在冻结时也没有输出任何内容。

«繁忙»组合也不起作用系统挂起时。

我发现的唯一相关性是,通常,在下一次开机时(强制关机后),笔记本电脑会多消耗 10W 的功率。但我怀疑这可能是偶然的。这种行为不仅限于系统在冻结后开机的次数。平均1.5次重启后,功耗恢复正常。

  • 该问题在任何内核 3.5.x - 3.7.1 中仍然存在。
  • WiFi关闭后问题仍然存在。
  • 笔记本电脑在 Windows XP 上工作得很好(我从来没有试过 7)
  • 我从未在这台机器上尝试过 32 位 Linux。
  • 我同时使用 VirtualBox 和 VMWare。当没有启动虚拟机时也会发生挂起,但我知道这两个程序都插入了一些内核模块。
  • 我使用 btrfs、dm-crypt、Huwavei E220 调制解调器、蓝牙和大量其他笔记本电脑常用的东西。

...

  • 我将粘贴您认为必要的任何日志/配置文件。

解决此冻结问题的下一步行动是什么?

由于对问题的原因一无所知,几乎可以尝试无数种组合。但也许你们中的一些人在调试硬件方面更有经验,可以提出一些常见的嫌疑人?

更新:

怀疑非标准的 Ubuntu 主线内核是罪魁祸首,我确实重新安装了整个系统,这次是使用基于 Ubuntu 12.10 的 Mint14,而后者又基于 3.5.x 内核家族。不幸的是,同样的问题:-(

更新 2:

悬挂事件的分布似乎是非泊松分布(即有时更频繁,有时更不频繁),但到目前为止我不知道如何将它与任何类型的事件相关联。无论是否以交互方式使用笔记本电脑,都会发生这种情况。当使用内存(并且使用系统页面 - 在我的例子中是 zram)和内存仅使用 30% 时,都会发生这种情况。

Ada*_*ski 2

终于我开始做某件事了。我不是 100% 确定,但看起来这是 Intel GMA HD3000 集成显卡的严重故障。长时间使用 3D 功能时可能会触发该问题。

非泊松失败率的解释是,有时我使用合成,有时不使用合成。我只是未能将合成与悬挂事件关联起来。

我在 Windows XP 下没有遇到问题的原因现在很明显了:Windows XP 不使用合成,而且我没有在上面玩游戏。所以没有使用3D。一旦我开始游戏,几个小时后图形适配器崩溃了。幸运的是,Windows XP(与 Linux 不同)能够或多或少地优雅地处理该问题,并且只需最少的设置(16 种颜色,480x640 分辨率)即可通知我有关情况。

现在拼图块已经很好地贴合了,回想起来,我想我可以确认 Linux 中的问题仅在打开合成时才出现。

我将发布另一个关于如何在 Linux 下诊断显卡错误的单独问题。