过热问题

Ara*_*ram 6 supermicro overheating

我已经建立了一个新系统,但它一直过热。它会在 BIOS 中正常运行,但是一旦我开始更密集的操作(例如尝试安装操作系统或使用实时版本),HSF 的 RPM 将急剧增加,并在几秒钟后伴随大量噪音,到目前为止据我所知,这表明 CPU 变热了。再过几秒钟后,前面的蓝色过热 LED 将亮起,BIOS 过热错误蜂鸣声会打扰我的耳朵。

在网上搜索后,我发现了三个可能的原因。

  • 由于电线阻塞或风扇故障导致气流不良;
  • 灰尘堆积;
  • 散热器安装不正确或损坏。

我已经附上了系统的图片,所以你可以自己看到气流。我认为这完全没问题,所有(四个)粉丝都在奔跑。当然,既然是新系统,灰尘堆积应该问题不大。

所以我认为是散热片有问题并将其拆下,检查散热片和 TIM 是否有任何损坏,但找不到任何损坏。我重新安装它并确保它牢固但不太牢固。然而同样的问题出现了。

为了希望它能起作用,我什至打开了我的箱子,让它运行,台扇指向它,但它仍然过热。

组件列表:

  • Supermicro 机箱 MT 500W CSE-732I-500B 黑色
  • Supermicro MBD-X9DRL-3F-O 双LGA2011主板
  • Supermicro FAN-0124L4 12 CM 1850 RPM 附加前置进气风扇
  • (1×) Intel Xeon E5-2620 2.0 GHz 六核处理器
  • Supermicro SNK-P0050AP4 3800 RPM 有源散热器
  • 西部数据 WD7500AZEX 750 GB 7200 RPM 硬盘驱动器
  • (4×) Corsair 8GB DDR3 1333 MHz RAM 卡。

我试图找出原因并尝试修复它,但我只是没有想法。请告诉我您认为可能/正在导致问题的原因。

我已经上传了系统的图片,所以你可以看到它,也许可以判断气流:

1

编辑:

我发现了一个新问题。现在它也在 BIOS 中关闭,但没有过热 LED 或错误提示音!你知道发生了什么吗?

mto*_*one 6

立即忘记机箱气流。打开机箱不会有问题,而关闭机箱则需要几分钟以上的时间才能造成不利影响,而且您没有足够的组件(耗电的显卡等)导致太多的问题。

可能是风扇的问题。如果您的风扇在最大速度下非常安静,则他们可能速度不够快。但是如果它们的声音相对较大——你似乎表明了这一点,我就不会担心它们。

知识就是力量:找出您的 CPU 在空闲时处于什么温度,以及它在负载下爬升的速度和速度(以及空闲/负载之间的增量)。运行SpeedFanCore Temp等温度监控软件,然后将这些读数返回给我们。

根据英特尔规范,TCase 最高温度为 77C。我不太熟悉至强上的 TCase(整个 CPU)与 TJunction(单个内核)的温度,但似乎单个内核可能不应该超过 77-5=72C。在软件测量中也允许 +/- 5C 偏移。在这里进一步阅读。

无论如何,乍一看,这似乎是一个安装不当的散热器。

  • 每次卸下 CPU 时,请使用少量异丙醇清除 CPU 顶部和散热器下方的任何残留导热油脂。

  • 这听起来可能很愚蠢,但请确保没有在 CPU 顶部或散热器下方留下薄薄的工厂塑料薄膜,以防止金属与金属接触。这会造成严重破坏。

  • 然后涂上一点导热油脂/糊状物/化合物(非常重要!)并小心而牢固地固定散热器。如果您不确定如何应用它,请仔细阅读:短篇文章长篇文章。导热膏不是很贵,所以选择质量好的。

  • 如短文中所述,您可以立即轻轻取下散热器并检查导热膏的分布情况,这可能有助于您检测不正确的散热器座 - 不够紧,甚至不够紧。毕竟,弯曲的散热器支架可能会妨碍正确接触。不要犹豫,清理它并重新开始。

编辑:我也同意 techie007 关于升级 BIOS/固件的建议。

  • @Aram 太好了,很高兴知道它有效!并且北极银 5 有大约 200 小时的使用磨合时间,因此它的效率将比目前进一步提高。 (2认同)

Ƭᴇc*_*007 5

更新主板的 BIOS 和IPMI固件,因为如果传感器没有被正确识别,它们可能会报告错误的过热。

通过这样做和/或使用他们的 IPMI 控制实用程序,您应该能够更新和刷新BMC,以便它知道安装了哪些传感器、风扇等。

您可以从SuperMicro 的支持站点获取它们。