高系统 CPU 负载 (%sys),系统锁定

Mar*_*ark 8 linux central-processing-unit

在过去的两周里,我们的系统 CPU 使用率(显示为 %sys)出现了间歇性的严重峰值,这可能会持续半分钟,锁定大多数进程,包括 ssh。

我一直在试图解决这个问题,但 atop 没有显示任何相关内容(它显示的进程的系统使用情况无关紧要),峰值是间歇性的,我无法使用该 Web 服务器托管的 Web 应用程序的任何工作负载重现峰值。

如果您对如何调试高 %sys 和(有时)%si CPU 使用率有任何想法,请分享它们。

系统规格(不知道这些是否相关):专用服务器,CentOS 6,核心 i7 950,始终可用的 4 至 8 GB RAM,硬盘为 RAID-1。

附加信息:

  • dmesg 输出在尖峰之间不会改变
  • /var/log/messages 在峰值之间不会改变
  • 这是cat /proc/vmstat
  • 这是典型峰值期间mpstat 1 的输出

添加 07.11.11:看起来像简单的重启恢复系统状态,我们可能永远不知道是什么导致了干扰。

Mar*_*ark 1

这听起来很愚蠢,但重新启动很有帮助,而且我们可能永远不知道是什么导致了峰值。

不过还是谢谢你的回复。

  • 对于下一个 `sar -I XALL 1 | grep -v 0.00` 会告诉您哪些中断正在获取软系统时间 (2认同)