小编K E*_*son的帖子

CPU 利用率高但平均负载低

我们遇到了一个奇怪的行为，我们看到 CPU 利用率很高，但平均负载很低。

我们监控系统的以下图表可以最好地说明这种行为。

CPU使用率和负载

在大约 11:57，CPU 利用率从 25% 上升到 75%。平均负载没有显着变化。

我们运行的服务器有 12 个内核，每个内核有 2 个超线程。操作系统将其视为 24 个 CPU。

CPU 利用率数据是通过/usr/bin/mpstat 60 1每分钟运行一次来收集的。all行和%usr列的数据显示在上面的图表中。我确信这确实显示了每个 CPU 数据的平均值，而不是“堆叠”利用率。虽然我们在图表中看到 75% 的利用率，但我们看到一个进程显示在top.

平均负载数字取自/proc/loadavg每分钟。

uname -a 给出：

Linux ab04 2.6.32-279.el6.x86_64 #1 SMP Wed Jun 13 18:24:36 EDT 2012 x86_64 x86_64 x86_64 GNU/Linux

Run Code Online (Sandbox Code Playgroud)

Linux 发行版是 Red Hat Enterprise Linux Server release 6.3 (Santiago)

我们在机器上以相当高的负载运行几个 Java Web 应用程序，每台机器每秒 100 个请求。

如果我正确解释了 CPU 利用率数据，当我们有 75% 的 CPU 利用率时，这意味着我们的 …

linux troubleshooting cpu-usage load-average

K E*_*son

2015 02-12

38
推荐指数

4
解决办法

8万
查看次数

具有绑定接口的机器不会在所有从属接口上接收多播数据包

将我们的计算机从 RHEL 6.6 升级到 RHEL 6.7 后，我们发现一个问题：30 台计算机中有 4 台仅在其两个从属接口之一上接收多播流量。目前尚不清楚升级是否相关，或者包含的重新启动是否触发了该行为 - 重新启动的情况很少见。

我们预计会在 4 个不同的端口上收到大量发往组 239.0.10.200 的多播数据包。如果我们检查ethtool其中一台有问题的机器上的统计信息，我们会看到以下输出：

健康的界面：

 # ethtool -S eth0 |grep mcast
 [0]: rx_mcast_packets: 294
 [0]: tx_mcast_packets: 0
 [1]: rx_mcast_packets: 68
 [1]: tx_mcast_packets: 0
 [2]: rx_mcast_packets: 2612869
 [2]: tx_mcast_packets: 305
 [3]: rx_mcast_packets: 0
 [3]: tx_mcast_packets: 0
 [4]: rx_mcast_packets: 2585571
 [4]: tx_mcast_packets: 0
 [5]: rx_mcast_packets: 2571341
 [5]: tx_mcast_packets: 0
 [6]: rx_mcast_packets: 0
 [6]: tx_mcast_packets: 8
 [7]: rx_mcast_packets: 9
 [7]: tx_mcast_packets: 0
 rx_mcast_packets: 7770152
 tx_mcast_packets: 313

Run Code Online (Sandbox Code Playgroud)

损坏的接口：

 # …

Run Code Online (Sandbox Code Playgroud)

networking linux troubleshooting multicast bonding

K E*_*son

2017 04-13

5
推荐指数

1
解决办法

4987
查看次数

VirtualBox 中运行的 Linux 上的内核 oops 破坏了服务器上的一些 IO 相关功能

我们在 Windows 7 计算机上的 VirtualBox 中运行 CentOS 版本 6.3 时遇到问题。症状如下：

几个小时甚至几天内一切正常。然后发生了一些破坏系统的事情。

发生这种情况后我们还能做什么：

访问网络服务器
使用现有的 SSH 会话来运行 top 和 free

什么不起作用：

启动新的 SSH 会话（输入用户名和密码后挂起）
在现有 SSH 会话中运行 ls（挂起）
SSI 包含来自我们的 Web 服务器，这些服务器从远程计算机获取数据
可能更多

当发生这种情况时，我们在服务器上看到的内容如下：

平均负载从基本没有上升到 3 左右
CPU 使用率仍然很低（5%）
磁盘活动低（运行 iostat）
有足够的可用内存
有足够的可用磁盘空间

在 /var/log/messages 中我们得到以下内容：

Jun 14 01:10:48 devvm kernel: e1000 0000:00:03.0: eth0: Detected Tx Unit Hang
Jun 14 01:10:48 devvm kernel:  Tx Queue             <0>
Jun 14 01:10:48 devvm kernel:  TDH                  <2e>
Jun 14 01:10:48 …

Run Code Online (Sandbox Code Playgroud)

linux server-crashes virtualbox kernel

K E*_*son

lucky-day

2
推荐指数

1
解决办法

3671
查看次数