小编asc*_*nts的帖子

用于高性能计算的 CPU 负载

在高性能计算的背景下，是否存在合理/安全的 CPU 负载水平？

我理解的意思的平均负载在一般的服务器，但不知道会发生什么，建成并用于高性能计算服务器。

通常的约定是否load <= # of cores适用于这种环境？

鉴于我的系统特定详细信息，我很好奇，通常load >> # of cores每个节点：

24 个物理内核，48 个虚拟内核的超线程（相对较新的硬件）
平均负载：通常为 100-300

节点的正常运行时间很长，CPU 使用率/负载通常很高。很少有硬件故障，尤其是 CPU，但我不知道在给定高负载的节点的整个生命周期中会发生什么。

示例top输出：

top - 14:12:53 up 4 days,  5:45,  1 user,  load average: 313.33, 418.36, 522.87
Tasks: 501 total,   5 running, 496 sleeping,   0 stopped,   0 zombie
%Cpu(s): 33.5 us, 50.9 sy,  0.0 ni, 15.6 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 19650371+total, 46456320 …

Run Code Online (Sandbox Code Playgroud)

linux central-processing-unit cpu-usage high-load load-average

asc*_*nts

2020 07-20

4
推荐指数

1
解决办法

219
查看次数