对 linux 服务器重新启动进行故障排除?

dav*_*avr 6 linux troubleshooting debian

我有一台刚刚安装的 Linux 服务器,debian Squeeze,2.6.32-5-amd64,在过去的一周里,它重新启动了 3 次,一天两次。我知道没有断电(并且它在 UPS 上运行),并且系统日志中没有错误,除了一些在启动时与清除 ext4 日志中的条目有关的预期错误之外不干净的关机。

我可以采取哪些步骤来确定重新启动的原因?有没有办法让它挂起而不是重新启动,这样我就可以从屏幕上复制堆栈跟踪或其他东西?有什么方法可以增加调试消息,或者让它将东西转储到磁盘,或者其他什么?

dmo*_*ati 0

检查 的输出last。寻找重启。尝试将其与谁登录(如果有人)以及谁拥有超级用户权限相关联。如果不是用户,您可能会遇到电源/热量问题或某种类型的内核恐慌导致的问题。尝试将这些一一排除。