我的服务器出现负载问题,尽管我是一位经验丰富的 Linux 管理员,但我现在已经没有想法了。
问题是服务器上的负载缓慢但稳定地增加,没有任何明显的原因。
服务器是带有 6GB RAM 的 AMD Athlon(tm) 64 X2 双核处理器 6000+。它运行带有 Linux gir 2.6.26-2-amd64 #1 SMP Wed Aug 19 22:33:18 UTC 2009 x86_64 GNU/Linux 的 Debian Stable。
该服务器基本上运行 Lighttpd、几个 FastCGI PHP 进程和一个 MySQL 数据库。典型的网络服务器任务。
CPU 永远不会真正用完,内存主要用于缓冲区和缓存,这很好。我试图重新启动各种服务,看看其中一个服务是否会再次减少负载,但没有运气。
以下是显示负载、CPU 和 IOStat 的图形:
所以,问题是:什么会导致负载缓慢但不断增加?我如何找出责任所在?
更新:我忘了提到,当我重新启动服务器时,负载将下降到 0.3 到 0.6 左右,并且在接下来的几周内将再次开始缓慢上升。
我的服务器在不同的工具中将频繁的分段错误记录到 /var/log/kern.log。到目前为止,我已经在 Perl、PHP 和 rsync 中看到过它们。所有安装的软件都是最新的 Debian 软件包。这是日志文件的摘录:
Mar 2 01:07:54 gaz kernel: [ 5316.246303] imapsync[4533]: segfault at 8b ip 00007fb448c98fe6 sp 00007ffff571dd68 error 4 in libperl.so.5.10.1[7fb448bd7000+164000]
Mar 2 01:17:42 gaz kernel: [ 5904.354307] php5-cgi[4441]: segfault at 2bb3dc8 ip 0000000002bb3dc8 sp 00007fffbeeaae48 error 15
Mar 2 02:54:05 gaz kernel: [11687.922316] php5-cgi[4495]: segfault at 2d7acf9 ip 0000000002d7acf9 sp 00007fff60c6eb18 error 15
Mar 2 10:50:08 gaz kernel: [40250.390322] BUG: unable to handle kernel paging request at 00000000024b03f0
Mar 2 10:50:08 gaz kernel: …Run Code Online (Sandbox Code Playgroud)