诊断内核恐慌

Ski*_*izz 5 ubuntu-9.04

我有一台运行 Ubuntu 9.04 并安装了 KDE 桌面的 PC。我将它用作文件/打印机/IMAP 服务器。通常,我打开它,然后使用其他计算机来工作。在屏幕上只有登录提示的情况下坐了几个小时后,系统会出现混乱 - 滚动锁定和大写锁定键盘灯闪烁。

我想解决这个问题。

然而,作为一个 linux noob,我不知道从哪里开始。

那么,问题是,诊断恐慌原因的最佳方法是什么?

我用谷歌搜索了一下,但通常解决方案(如果有的话)是模糊的。理想情况下,答案最终会是缩小恐慌原因所需步骤的流程图。

有关更多详细信息和问题,请参阅下面的回复。

Ski*_*izz 2

这是我所做的(请随意更正下面的任何建议):

更新软件

我注意到在下面提到的控制台视图中,在出现紧急消息之前有一个对 bitmap_weight 的调用。我在 nVidia 的网站上找到了新版本的视频驱动程序,所以我下载并安装了它。我还运行了更新管理器来更新机器上的所有软件。我仍然感到恐慌,但实例之间的时间似乎更长。我想确保您已获得所有最新更新始终是明智的。更新:不,恐慌没有改变,即使 Ctrl-Alt-F7 控制台也显示相同的消息(如何将其写入文件?!)。

Memtest86+(链接)

如果尚未出现,则在启动过程中按“esc”将显示 grub 菜单。此菜单上有一个运行 Memtest86+ 的选项。在 Ubuntu 9.04 上,这是 V2.11。他们的网站上有 V4.00。您需要下载 ISO CD 映像,用它刻录 CD,重新启动计算机并从 CD 启动。对于我的问题,默认测试没有突出任何问题。按“c”显示配置菜单,这里可以执行一项附加测试 - 位淡入淡出测试。这个需要很长时间才能运行(当我键入此内容时它当前正在运行)。如果这确实突出了问题,请尝试更换内存芯片并重复测试。如果仍然失败,那么您可能需要一块新主板。

测试结果:今天早上我检查了电脑,memtest 仍在运行 - 9 小时没有错误。一开始它确实让我感到困惑,因为它正在做一点褪色测试,计时器显示 20 分钟。我以为它已经重新启动了,但实际上计时器只是从位淡出测试开始以来的时间。切换回默认测试会导致显示的时间显示总的正常运行时间。所以看来内存是没问题的。

kexec-tools 和控制台视图

我现在已经安装了 kexec-tools,尽管它是一个复杂的野兽,所以我认为我现在不会得到任何有用的东西。然而,在这样做的过程中,我发现了一个页面,其中列出了一些有用的键盘快捷键。登录时,我按 Ctrl-Alt-F8 显示控制台输出。我让机器继续运行,它出现了恐慌 - 控制台确实显示了一些消息,其中之一是恐慌消息。现在,如果将此输出保存到文件中,那将非常有用,因为它只有大约 25 行可见消息。有谁知道这个文件在哪里或者如何获取它来保存输出?

因此,在 X 控制台(Ctrl-Alt-F8 屏幕)中,日志中的函数之一是 bitmap_weight,所以我认为它可能是显卡。

关闭视频

/etc 文件夹中有一组名为 rc0.d、rc1.d 等的文件夹,其中包含一组用于设置系统的脚本。通常,rc2.d 中的脚本会在系统启动时执行。在这里,启动窗口管理器的脚本对于 Gnome 称为 S30gdm,对于 KDE 称为 S30kdm。将它们重命名为 K70gdm / K70kdm 并重新启动系统。您现在有一个文本提示登录,GUI 已禁用。这样做后,系统变得更加稳定,它整夜都保持活力,这是以前从未做过的。我有一个 nVidia 视频卡,查看他们的网站,我发现视频驱动程序最近有更新。我现在已经安装了这个,将看看问题是否仍然存在。我应该在这里指出,我确实使系统保持最新的更新,并且我认为有一个内核更新可能会影响旧的视频驱动程序。

最后,要恢复 GUI,请将 K70gdm 和/或 K70kdm 重命名回 S30gdm / S30kdm 并重新启动。