Ara*_*ram 6 supermicro overheating
我已经建立了一个新系统,但它一直过热。它会在 BIOS 中正常运行,但是一旦我开始更密集的操作(例如尝试安装操作系统或使用实时版本),HSF 的 RPM 将急剧增加,并在几秒钟后伴随大量噪音,到目前为止据我所知,这表明 CPU 变热了。再过几秒钟后,前面的蓝色过热 LED 将亮起,BIOS 过热错误蜂鸣声会打扰我的耳朵。
在网上搜索后,我发现了三个可能的原因。
我已经附上了系统的图片,所以你可以自己看到气流。我认为这完全没问题,所有(四个)粉丝都在奔跑。当然,既然是新系统,灰尘堆积应该问题不大。
所以我认为是散热片有问题并将其拆下,检查散热片和 TIM 是否有任何损坏,但找不到任何损坏。我重新安装它并确保它牢固但不太牢固。然而同样的问题出现了。
为了希望它能起作用,我什至打开了我的箱子,让它运行,台扇指向它,但它仍然过热。
组件列表:
我试图找出原因并尝试修复它,但我只是没有想法。请告诉我您认为可能/正在导致问题的原因。
我已经上传了系统的图片,所以你可以看到它,也许可以判断气流:
编辑:
我发现了一个新问题。现在它也在 BIOS 中关闭,但没有过热 LED 或错误提示音!你知道发生了什么吗?
立即忘记机箱气流。打开机箱不会有问题,而关闭机箱则需要几分钟以上的时间才能造成不利影响,而且您没有足够的组件(耗电的显卡等)导致太多的问题。
这可能是风扇的问题。如果您的风扇在最大速度下非常安静,则他们可能速度不够快。但是如果它们的声音相对较大——你似乎表明了这一点,我就不会担心它们。
知识就是力量:找出您的 CPU 在空闲时处于什么温度,以及它在负载下爬升的速度和速度(以及空闲/负载之间的增量)。运行SpeedFan或Core Temp等温度监控软件,然后将这些读数返回给我们。
根据英特尔规范,TCase 最高温度为 77C。我不太熟悉至强上的 TCase(整个 CPU)与 TJunction(单个内核)的温度,但似乎单个内核可能不应该超过 77-5=72C。在软件测量中也允许 +/- 5C 偏移。在这里进一步阅读。
无论如何,乍一看,这似乎是一个安装不当的散热器。
每次卸下 CPU 时,请使用少量异丙醇清除 CPU 顶部和散热器下方的任何残留导热油脂。
这听起来可能很愚蠢,但请确保没有在 CPU 顶部或散热器下方留下薄薄的工厂塑料薄膜,以防止金属与金属接触。这会造成严重破坏。
然后涂上一点导热油脂/糊状物/化合物(非常重要!)并小心而牢固地固定散热器。如果您不确定如何应用它,请仔细阅读:短篇文章或长篇文章。导热膏不是很贵,所以选择质量好的。
如短文中所述,您可以立即轻轻取下散热器并检查导热膏的分布情况,这可能有助于您检测不正确的散热器座 - 不够紧,甚至不够紧。毕竟,弯曲的散热器支架可能会妨碍正确接触。不要犹豫,清理它并重新开始。
编辑:我也同意 techie007 关于升级 BIOS/固件的建议。
更新主板的 BIOS 和IPMI固件,因为如果传感器没有被正确识别,它们可能会报告错误的过热。
通过这样做和/或使用他们的 IPMI 控制实用程序,您应该能够更新和刷新BMC,以便它知道安装了哪些传感器、风扇等。
您可以从SuperMicro 的支持站点获取它们。
| 归档时间: |
|
| 查看次数: |
11166 次 |
| 最近记录: |