小编asc*_*nts的帖子

用于高性能计算的 CPU 负载

在高性能计算的背景下,是否存在合理/安全的 CPU 负载水平?

我理解的意思平均负载在一般的服务器,但不知道会发生什么,建成并用于高性能计算服务器。

通常的约定是否load <= # of cores适用于这种环境?


鉴于我的系统特定详细信息,我很好奇,通常load >> # of cores每个节点:

  • 24 个物理内核,48 个虚拟内核的超线程(相对较新的硬件)
  • 平均负载:通常为 100-300

节点的正常运行时间很长,CPU 使用率/负载通常很高。很少有硬件故障,尤其是 CPU,但我不知道在给定高负载的节点的整个生命周期中会发生什么。

示例top输出:

top - 14:12:53 up 4 days,  5:45,  1 user,  load average: 313.33, 418.36, 522.87
Tasks: 501 total,   5 running, 496 sleeping,   0 stopped,   0 zombie
%Cpu(s): 33.5 us, 50.9 sy,  0.0 ni, 15.6 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 19650371+total, 46456320 …
Run Code Online (Sandbox Code Playgroud)

linux central-processing-unit cpu-usage high-load load-average

4
推荐指数
1
解决办法
219
查看次数