Linux服务器挂了,到哪里找可能的原因?

sno*_*261 4 linux hangs

Linux 服务器在不知道确切原因的情况下多次挂起。我应该查看哪个文件或日志?服务器响应ping,但我无法通过 ssh 连接到它。当我将显示器插入其中时,它没有任何响应。任何的想法?

Pra*_*era 7

内核挂起很难调试,因为在崩溃的情况下屏幕上没有显示 oops 消息,如果你真的很幸运,你会在 /var/log/messages 中看到一些东西,因为在挂起期间你的整个系统与 syslog 守护进程一起挂起,什么都不会写入这些文件中。

这样说的挂起可以像由于内存或 CPU 争用导致的临时性能问题一样简单,使用低效算法或可能像死锁一样复杂。所以就像我上面提到的,如果你真的很幸运

1:检查 /var/log/messages 或运行 dmesg 以获取一些指针 2:如果您的系统定期挂起,则配置 kdump 和 sysrq 密钥以了解确切的问题。

有关更多信息,请参阅 http://people.redhat.com/anderson/crash_whitepaper/