如何对挂起的 Linux 机器进行故障排除

Ale*_*ber 6 linux diagnostic

有一个流行的求职面试问题:

鉴于机器挂断(假设是 RHEL),您如何解决问题?

我的回答是:

1)我会使用(允许您连接到其控制台的服务器 BIOS 的名称是什么?)或者去服务器机房并将显示器和键盘连接到它并以 root 身份登录。

2)然后我会运行“top”来查看某个进程是否有很高的 CPU 使用率

3)然后我会检查内存(再次通过“top”?)和进程总数(“ps uawx”)和系统限制(如何,“limit”会给我正确的数字)?

然后我不知道。也许运行“vm”?但它会告诉我什么?

请给我一些好的建议和对招聘人员印象深刻的句子。

Sga*_*uuw 11

你可以

对于非常糟糕的锁定,您还可以使用Magic SysRq键从系统中提取一些信息。

其他需要查看的地方是 CMDB,查看服务器之前是否记录了任何问题,以及是否有可接受的解决方法和/或计划的问题修复。你甚至可以问问同事。一份工作不仅仅是技术实力。

  • 这是一个很好的答案,谢谢。我同意询问同事。 (2认同)