Dar*_*enW 20 linux logs arch-linux kernel-panic forensics
我的 Arch 机器有时会挂起,突然对鼠标或键盘没有任何响应。光标被冻结。Ctrl-Alt-Backsp 不会停止 X11,而 ctrl-alt-del 什么也不做。conky 和 icewm 中的 CPU、网络和磁盘活动图停止更新。几分钟后,风扇打开。让计算机做任何事情的唯一方法就是关闭电源。
启动时,CPU 温度监视器显示 70 到 80C。在挂起之前,我通常会做一些低强度的活动,比如在 50 摄氏度左右的网上冲浪。
与正常关机相比,日志没有显示任何特别之处。内存检查器运行良好,缺陷为零。
我如何调查挂断的原因?我可以找到额外的信息来寻找线索吗?有什么比关闭电源更激烈的动作来获得某种动作,如果只有一些有限的外壳或只是哔哔声,但可能会提供线索?
这台机器是 Gateway P6860 17" 笔记本电脑(笨重但功能强大),它运行的是 Arch 64 位,最新(截至 2011 年 3 月)。我用 Arch 很长时间没有这个问题,切换到 Ubuntu 大约一个星期然后退回到全新安装的 Arch。那是绞刑开始的时候。
更新:是的,肯定是过热了。在某一温度下,鼠标和键盘会停止工作,有时会在冷却几分钟后开始工作。在更高的温度下,会发生更糟糕的事情,例如完全无响应,包括忽略 SysRq。这种情况之后不久就会突然断电。我已经通过购买新电脑 8D 解决了这个问题
Fre*_*rdt 11
关于冻结,有几个选项:
使用串行端口,如果你的盒子有一个通过添加console=ttyS0到引导选项来获取转储,如here所述。您需要第二台带有串行端口和空调制解调器电缆的机器来捕获转储文件。
使用 netconsole 通过网络获取转储,请参见此处。
以这种方式使用 kexec/kdump 可以获得本地转储,请参见此处。
关于干净的断电问题,我建议您使用神奇的 SysRq 键来“同步”光盘,“U”安装它们,然后重新“启动”盒子(字母是您应该与 alt 一起键入的字母) -sysrq。
编辑:如果您将 oops/trace 发布到 lkml,您应该使用最新(最好是最新)版本的内核并且没有专有模块。
如果内核仍在运行,并且没有真正挂起,Frederik 的涉及魔术 SysRq 和内核转储的答案将起作用。由于某种原因,内核可能只是忙于循环。
它不响应 Ctrl-Alt-Del 的事实告诉我,情况可能并非如此,而且机器正在严重锁定。这意味着硬件故障,或密切相关的东西,如坏驱动程序。
如果您让它运行足够长的时间,您的内存检查测试很好。您还应该尝试其他方法来尝试对系统施加压力,例如StressLinux。长期运行的基准测试也很好。
另一件要尝试的事情是使用 Ubuntu live CD 启动系统并尝试正常使用系统。如果像这样暂时返回 Ubuntu 不会导致问题再次发生,那么很有可能它实际上并不是硬件损坏,而是相关的问题之一,例如驱动程序错误或内核配置不正确。很可能像 Ubuntu 这样更流行的发行版比 Arch 这样的发行版具有更稳定的内核配置,这仅仅是因为在发行版的测试阶段试用了更多的机器。
| 归档时间: |
|
| 查看次数: |
20454 次 |
| 最近记录: |