找出高 CPU 使用率的 apache 进程实际上在做什么?

BT6*_*643 19 linux top strace apache-2.2 ubuntu-12.04

目前我们的服务器存在一些问题,间歇性地,我们似乎得到了 apache 进程,这些进程只是运行和运行,占用 100% 的 CPU。

运行 top 时,我们看到以下内容:

PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
20788 www-data  20   0  318m  18m 3984 R  100  0.0  40:29.21 /usr/sbin/apache2 -k start
23523 www-data  20   0  319m  20m 4684 R  100  0.0   4:12.36 /usr/sbin/apache2 -k start
Run Code Online (Sandbox Code Playgroud)

我想尝试找出导致这种情况的脚本(或任何脚本),所以我尝试了:

 strace -p 20788
Run Code Online (Sandbox Code Playgroud)

但这根本没有显示任何输出(我已经离开了大约 10 分钟,它什么也没显示)。根据我的理解,这可能意味着它陷入了无限循环,并且没有任何“系统调用”可以显示。

我还能做些什么来显示正在发生的事情吗?

谢谢

编辑 -忘了说,这是一个随时都有几百个用户的实时服务器!所以我真的不能随意尝试更改配置选项并重新启动 apache。

编辑 2 - 当 PHP 未配置 --enable-debug 时,来自 gdb 的回溯 (bt) 似乎并不是那么有用 - 它只显示“execute()”,但我需要知道 PHP 脚本是什么实际运行..还有其他方法吗?

#0  0x00007f6c143fb0c5 in ?? () from /usr/lib/apache2/modules/libphp5.so
#1  0x00007f6c143b040b in execute () from /usr/lib/apache2/modules/libphp5.so
#2  0x00007f6c1438b970 in zend_execute_scripts () from     /usr/lib/apache2/modules/libphp5.so
#3  0x00007f6c14337fe3 in php_execute_script () from     /usr/lib/apache2/modules/libphp5.so
#4  0x00007f6c1441ae7d in ?? () from /usr/lib/apache2/modules/libphp5.so
#5  0x00007f6c18912508 in ap_run_handler ()
#6  0x00007f6c1891297e in ap_invoke_handler ()
#7  0x00007f6c18922570 in ap_process_request ()
#8  0x00007f6c1891f398 in ?? ()
#9  0x00007f6c18918fa8 in ap_run_process_connection ()
#10 0x00007f6c189271d0 in ?? ()
#11 0x00007f6c1892793a in ?? ()
#12 0x00007f6c189284e7 in ap_mpm_run ()
#13 0x00007f6c188fd4a4 in main ()
Run Code Online (Sandbox Code Playgroud)

poi*_*ige 9

好吧,如果你觉得勇敢:

gdb -p 20788

然后发出bt以查看堆栈帧,例如

顺便说一句,还有ltrace一点值得一提——也试试吧。

更新。: 好吧,既然我们知道 Apache 真的在运行某些东西,为什么不看看mod_status输出——扩展的

  • 实现 mod_status 已经默认启用,它只是限制从 127.0.0.1 访问。我刚刚通过 SSH 登录并将输出通过管道传输到文件 `curl domain.com/server-status > randomfile.html` - 然后查看该文件。原来这是一个旧的开发人员代码陷入循环(PHP 文件)!现在都整理好了。谢谢您的帮助 :) (4认同)

小智 6

一个非常简单的方法是使用htop. 您可以对高 CPU 进程进行排序,然后使用

  • s 代表strace一个进程
  • l 用于lsof查看进程打开的文件
  • 升到ltrace

我发现至少其中一个选项可以找到生成负载的脚本,您当然可以在生产 Web 服务器上使用它来进行调试。