是什么导致了异常高的平均负载?

Jam*_*mes 7 iowait load-average

我注意到在上周的周二晚上,平均负载急剧上升,并且由于流量小而看起来不正常。通常,这些数字通常平均约为 0.40 或更低,并且我的服务器内容(mysql、php 和 apache)已优化。我注意到 IOWait 异常高,即使进程几乎不使用任何 CPU。

top - 01:44:39 up 1 day, 21:13, 1 user, load average: 1.41, 1.09, 0.86
任务:总共 60 个,运行 1 个,睡眠 59 个,停止 0 个,僵尸 0 个
Cpu0 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu1:0.0%us、0.0%sy、0.0%ni、100.0%id、0.0%wa、0.0%hi、0.0%si、0.0%st
Cpu2:0.0%us、0.3%sy、0.0%ni、99.7%id、0.0%wa、0.0%hi、0.0%si、0.0%st
Cpu3:0.0%us、0.0%sy、0.0%ni、100.0%id、0.0%wa、0.0%hi、0.0%si、0.0%st
Cpu4:0.0%us、0.0%sy、0.0%ni、100.0%id、0.0%wa、0.0%hi、0.0%si、0.0%st
Cpu5:0.0%us、0.0%sy、0.0%ni、100.0%id、0.0%wa、0.0%hi、0.0%si、0.0%st
Cpu6:0.0%us、0.0%sy、0.0%ni、100.0%id、0.0%wa、0.0%hi、0.0%si、0.0%st
Cpu7:0.0%us、0.0%sy、0.0%ni、91.5%id、8.5%wa、0.0%hi、0.0%si、0.0%st
内存:总共 1048576k,已使用 331944k,716632k 空闲,0k 缓冲区
交换:总共 0k,已使用 0k,空闲 0k,缓存 0k

  PID 用户 PR NI VIRT RES SHR S %CPU %MEM TIME+ 命令           
    1 根 15 0 2468 1376 1140 S 0 0.1 0:00.92 初始化               
 1656 根 15 0 13652 5212 664 S 0 0.5 0:00.00 apache2            
 9323 根 18 0 13652 5212 664 S 0 0.5 0:00.00 apache2            
10079 根 18 0 3972 1248 972 S 0 0.1 0:00.00 su                 
10080 根 15 0 4612 1956 1448 S 0 0.2 0:00.01 bash               
11298 根 15 0 13652 5212 664 S 0 0.5 0:00.00 apache2            
11778 chikorit 15 0 2344 1092 884 S 0 0.1 0:00.05 顶部                
15384 根 18 0 17544 13m 1568 S 0 1.3 0:02.28 miniserv.pl        
15585 根 15 0 8280 2736 2168 S 0 0.3 0:00.02 sshd               
15608 chikorit 15 0 8280 1436 860 S 0 0.1 0:00.02 sshd      

这是 VMStat

procs -----------内存----------- ---swap-- -----io---- -system-- ----cpu-- ——
 rb swpd 免费 buff 缓存 si so bi bo in cs us sy id wa
 1 0 0 768644 0 0 0 0 14 23 0 10 1 0 99 0

IOStat - 没什么不寻常的

总磁盘读取:67.13 K/s | 总磁盘写入:0.00 B/s
  TID PRIO 用户磁盘读磁盘写交换 IO> 命令          
19496 be/4 chikorit 11.85 K/s 0.00 B/s 0.00 % 0.00 % apache2 -k 开始
19501 be/4 mysql 3.95 K/s 0.00 B/s 0.00 % 0.00 % mysqld
19568 be/4 chikorit 11.85 K/s 0.00 B/s 0.00 % 0.00 % apache2 -k 开始
19569 be/4 chikorit 11.85 K/s 0.00 B/s 0.00 % 0.00 % apache2 -k 开始
19570 be/4 chikorit 11.85 K/s 0.00 B/s 0.00 % 0.00 % apache2 -k 开始
19571 be/4 chikorit 7.90 K/s 0.00 B/s 0.00 % 0.00 % apache2 -k 开始
19573 be/4 chikorit 7.90 K/s 0.00 B/s 0.00 % 0.00 % apache2 -k 开始
    1 be/4 根 0.00 B/s 0.00 B/s 0.00 % 0.00 % init
11778 be/4 chikorit 0.00 B/s 0.00 B/s 0.00 % 0.00 % 顶部
19470 be/4 mysql 0.00 B/s 0.00 B/s 0.00 % 0.00 % mysqld

负载平均图表 - http://i.stack.imgur.com/kYsD0.png

在确定之前,我想确定这是否不是 MySQL 问题。此外,这是 OpenVZ 上的 Ubuntu 10.04 LTS 服务器。

编辑:这可能会在 IO 等待上给出一个很好的画面

top - 22:12:22 up 17:41, 1 user, load average: 1.10, 1.09, 0.93
任务:总共 33 个,运行 1 个,睡眠 32 个,停止 0 个,僵尸 0 个
Cpu(s): 0.6%us, 0.2%sy, 0.0%ni, 89.0%id, 10.1%wa, 0.0%hi, 0.0%si, 0.0%st
内存:总共 1048576k,已使用 260708k,空闲 787868k,0k 缓冲区
交换:总共 0k,已使用 0k,空闲 0k,缓存 0k

PID 用户 PR NI VIRT RES SHR S %CPU %MEM TIME+ 命令 
1 根 15 0 2468 1376 1140 S 0 0.1 0:00.88 初始化 
5849 根 15 0 12336 4028 668 S 0 0.4 0:00.00 apache2 
8063 根 15 0 12336 4028 668 S 0 0.4 0:00.00 apache2 
9732 根 16 0 8280 2728 2168 S 0 0.3 0:00.02 sshd 
9746 chikorit 18 0 8412 1444 864 S 0 0.1 0:01.10 sshd 
9747 chikorit 18 0 4576 1960 1488 S 0 0.2 0:00.24 bash 
13706 chikorit 15 0 2344 1088 884 R 0 0.1 0:00.03 顶部 
15745 chikorit 15 0 12968 5108 1280 S 0 0.5 0:00.00 apache2 
15751 chikorit 15 0 72184 25m 18m S 0 2.5 0:00.37 php5-fpm 
15790 chikorit 18 0 12472 4640 1192 S 0 0.4 0:00.00 apache2 
15797 chikorit 15 0 72888 23m 16m S 0 2.3 0:00.06 php5-fpm 
16038 根 15 0 67772 2848 592 D 0 0.3 0:00.00 php5-fpm 
16309 系统日志 18 0 24084 1316 992 S 0 0.1 0:00.07 rsyslogd 
16316 根 15 0 5472 908 500 S 0 0.1 0:00.00 sshd 
16326 根 15 0 2304 908 712 S 0 0.1 0:00.02 cron 
17464 根 15 0 10252 7560 856 D 0 0.7 0:01.88 psad 
17466 根 18 0 1684 276 208 S 0 0.0 0:00.31 psadwatchd 
17559 根 18 0 11444 2020 732 S 0 0.2 0:00.47 sendmail-mta 
17688 根 15 0 10252 5388 1136 S 0 0.5 0:03.81 蟒蛇 
17752 teampea 19 0 44648 7308 4676 S 0 0.7 1:09.70 ts3server_linux 
18098 根 15 0 12336 6380 3032 S 0 0.6 0:00.47 apache2 
18099 chikorit 18 0 10368 2536 464 S 0 0.2 0:00.00 apache2 
18120 ntp 15 0 4336 1316 984 S 0 0.1 0:00.87 ntpd 
18379 根 15 0 12336 4028 668 S 0 0.4 0:00.00 apache2 
18387 mysql 15 0 62796 36m 5864 S 0 3.6 1:43.26 mysqld 
19584 根 15 0 12336 4028 668 S 0 0.4 0:00.02 apache2 
22498 根 16 0 12336 4028 668 S 0 0.4 0:00.00 apache2 
24260 根 15 0 67772 3612 1356 S 0 0.3 0:00.22 php5-fpm 
27712 根 15 0 12336 4028 668 S 0 0.4 0:00.00 apache2 
27730 根 15 0 12336 4028 668 S 0 0.4 0:00.00 apache2 
30343 根 15 0 12336 4028 668 S 0 0.4 0:00.00 apache2 
30366 根 15 0 12336 4028 668 S 0 0.4 0:00.00 apache2 

这是截至今天的免费 ram。

             缓存的已用空闲共享缓冲区总数
内存:1024 302 721 0 0 0
-/+ 缓冲区/缓存:302 721
交换:0 0 0

更新:查看日志,尤其是导致 CPU 峰值的 PHP5-FPM。我发现它的段由于某种明显的原因出现故障。

[03-Jun-2012 06:11:20] 注意:[pool www] child 14132 开始
[03-Jun-2012 06:11:25] 警告:[pool www] child 13664 从开始后 53.686322 秒后退出信号 11 (SIGSEGV)
[03-Jun-2012 06:11:25] 注意:[pool www] child 14328 开始
[03-Jun-2012 06:11:25] 警告:[pool www] child 14132 从开始后 4.708681 秒后退出信号 11 (SIGSEGV)
[03-Jun-2012 06:11:25] 注意:[pool www] child 14329 开始
[03-Jun-2012 06:11:58] 警告:[pool www] child 14328 从开始后 32.981228 秒后退出信号 11 (SIGSEGV)
[03-Jun-2012 06:11:58] 注意:[pool www] child 15745 开始
[03-Jun-2012 06:12:25] 警告:[pool www] child 15745 从开始后 27.442864 秒后退出信号 11 (SIGSEGV)
[03-Jun-2012 06:12:25] 注意:[pool www] child 17446 开始
[03-Jun-2012 06:12:25] 警告:[pool www] child 14329 从开始后 60.411278 秒后退出信号 11 (SIGSEGV)
[03-Jun-2012 06:12:25] 注意:[pool www] child 17447 开始
[03-Jun-2012 06:13:02] 警告:[pool www] child 17446 从开始后 36.746793 秒后退出信号 11 (SIGSEGV)
[03-Jun-2012 06:13:02] 注意:[pool www] child 18133 开始
[03-Jun-2012 06:13:48] 警告:[pool www] child 17447 从开始后 82.710107 秒后退出信号 11 (SIGSEGV)

我认为这可能是导致问题的原因。如果这是原因,可能将其关闭到 fastcgi/fcgid 可能会解决它......但是,我想看看是否还有其他原因可能导致它这样做。

Jam*_*mes 0

从表面上看,CPU 使用率高可能是由 Wordpress 插件、Google XML Sitemap 生成器引起的。禁用该功能后,CPU 平均值大部分下降。尽管如此,还是要审核插件以删除任何可能使用过多 CPU 的插件。