“按下电源键”意外关机。日志

use*_*435 0 linux shutdown centos

我的 Supermicro 刀片服务器自动关闭并显示以下日志。可能是什么原因?(AFIK 没人碰过它!)

  • 事件发生前的几个小时内,CPU 使用率约为 50%。
  • 这个问题在过去几周发生了几次,都是在系统上有类似负载时发生的。
  • BIOS 事件日志中没有高温(或其他任何内容)条目。
  • IPMI 日志中没有注册事件
  • CentOS Linux 版本 7.5.1804,内核 3.10.0-862.6.3.el7.x86_64
09:04:30 hostname ***some event***
09:30:52 hostname systemd-logind: Power key pressed.
09:30:52 hostname systemd-logind: Power key pressed.
09:30:52 hostname systemd-logind: Powering Off...
09:30:52 hostname systemd-logind: System is powering down.
09:30:52 hostname systemd-logind: Powering Off...
09:30:52 hostname systemd-logind: System is powering down.
09:30:52 hostname systemd: Stopping Authorization Manager...
09:30:52 hostname systemd: Stopping Authorization Manager...
Run Code Online (Sandbox Code Playgroud)

der*_*ert 6

最明显的答案当然是有人按下了电源按钮。可能是意外——例如,如果电源按钮很敏感并且有人在路过时轻轻撞到了它。电源按钮故障(例如,弹簧已磨损)也会发生这种情况。通过在电源按钮上安装某种Molly 防护装置,可以帮助意外按下电源按钮。

要求从例如 IPMI 正常关闭通常也会注册为按下电源按钮。

另一种可能性是(电)噪声使系统认为已按下电源按钮。确保电源按钮的电线牢固地固定在板上(和开关,如果没有焊接)并检查电缆布线以确保电线远离任何具有大/可变功耗的东西。

如果没有其他效果,您可以编辑/etc/systemd/logind.conf并更改HandlePowerKeyignore(然后重新启动 systemd-logind)。这应该会阻止系统关闭,但这确实意味着您将无法使用电源按钮启动干净关闭(保持 4 秒的不干净关闭,如果有的话,不能被禁用)通过 systemd,因为它是由系统固件完成的)。