在双 CPU 服务器上,一个 CPU 比另一个运行得更热是否正常?

sam*_*moz 51 central-processing-unit physical-environment

我有一个双 Opteron 服务器,它运行带有 libvirt 的 Linux 来托管多个 VM。虚拟机工作正常,服务器处理正常,但我注意到一个 CPU 始终运行在 69C 左右(节流在 70C),另一个运行在 15C 左右。

这对我来说似乎不正常?他们俩的温度不应该更接近一点吗?

我不确定如何进一步处理。也许其中一个 CPU 上没有足够的导热膏?

编辑:主板是华硕 KGPE-D16,由双Noctua NH-U9DO 风扇冷却。

请注意,我认为温度可能会高于环境温度,而不是绝对值?当服务器空闲时,CPU 温度下降到 2C 和 13C。我正在使用这里的 lmsensors 配置

sam*_*moz 107

问题最终是一个不合适的散热器。也许不合身不是正确的描述。事实证明,您必须将导热膏放在散热器上,而不是放在散热器上方的塑料盖上。

在此处输入图片说明

取下塑料盖后,CPU 又漂亮又酷,谢谢大家!

  • +1 只是因为它很有趣 (52认同)
  • 你的意思是有人把塑料盖留在原地,然后在上面涂上糊状物,然后把散热器放在上面?史诗。 (10认同)
  • 我喜欢您在后台看到条款和条件、有限保修和退货政策的方式。:) (8认同)
  • 如果它让你觉得不那么愚蠢(而且不会),我对我的新办公室咖啡机做了类似的事情。咖啡太冷了不能喝,我正在打包准备返回商店,然后一块保护纸板从加热元件上掉下来:) (6认同)
  • 啊啊啊啊啊啊啊啊!! (4认同)
  • @Grant:他已经解决了这个问题。阅读_整个_段落。他的传感器给出的温度高于环境温度或校准的“预期”值。事实上,以这种方式安装散热器,在更热的核心上获得 69ºC 绝对温度将是一个奇迹。 (3认同)
  • 这绝对是您问题的很大一部分!但是,除非您将服务器包裹在干冰或其他东西中,否则它仍然无法解释读数为 2 摄氏度的传感器。 (2认同)

Mad*_*ter 25

根据我的经验,机箱中的成对组件在不同温度下运行是正常的,因为每个地方的气流都不相同。这是来自我的 colo 盒的硬盘温度图。驱动器是镜像的,因此它们上的工作负载几乎相同。

过去一年 HDD 温度的 munin 图

如您所见,它们相互跟踪,但它们并不相同;平均而言,它们也仅相隔 6C。无论您的传感器报告绝对温度还是过热,负载下 55C 的差异似乎都非常错误。如果您有信心数据是正确的,那么考虑到静态差异下降到 10C,这是我看到的由于气流而导致的差异,我怀疑散热片安装不当。


Tom*_*Tom 8

它不是。除非你的气流有一些严重的问题。或者其中一个冷却器坏了。温度会有所不同 - 但不会太大(70 与 15 摄氏度)。

考虑到 15 度有多低,我会假设 (a) 您的传感器已关闭(您真的将服务器存放在那个凉爽的房间里?)。

我还假设其中一个 CPU 根本不工作,无论出于何种原因。

小的差异是正常的。一些稍大的可能是(气流进入我的脑海)。但在这里我们谈论的是冷。