CPU温度经常达到100°C

Mar*_*k K 13 cpu temperature sensors

我有一台配备 Intel i7-12700 32GB RAM 的新台式电脑。

我正在做构建代码的工作,我使用sensors命令来检查CPU温度,我发现大多数核心都是@ 100C。

这正常吗?

CPU硬件本身会控制频率以适应温度吗?

更新

我检查了dmesg,发现了很多日志,如下所示:

mce: CPUxx: Package temperature above threshold, cpu clock throttled
Run Code Online (Sandbox Code Playgroud)

看起来CPU控制本身不高于100C。

Ste*_*itt 19

您的系统\xe2\x80\x99 是否正常取决于多种因素;然而 100\xc2\xb0C 对于桌面系统来说是高端的,你应该尝试解决这个问题。通常,这将涉及改进系统\xe2\x80\x99s 冷却:机箱本身的整体气流(假设您的 CPU 是\xe2\x80\x99t 水冷)、CPU 冷却器及其与 CPU 的接口等。

\n

无论如何,你的CPU不会\xe2\x80\x99自己做饭:它知道自己的极限,如果需要冷却,它会自我调节(降低频率)。如果发生这种情况,您\xe2\x80\x99 将在内核日志中看到相应的消息 ( sudo dmesg)。

\n

  • 虽然 CPU 绝对不会自行烧毁,但机箱内的高温会缩短电解电容器和硬盘驱动器的寿命,因此有理由尝试对其进行冷却。 (6认同)
  • **像我相信的较旧的 x86 CPU [1] 第一个奔腾及更旧的 CPU 没有办法在变得太热时关闭,并且如果它们变得太热可能会毁掉自己。但在原始奔腾之后的每个 x86 CPU 都有一种在变得太热时关闭的方法。** [1] 我不记得具有“如果太热则关闭”功能的确切年份/品牌/型号。(有趣的事实是,在“过热关机”功能之前,理论上您可以通过软件破坏硬件)。 (5认同)
  • 如果太热,IIRC Pentium 3 将关闭,而 Pentium 4 及更高版本将进行热节流(即继续以较慢的速度工作)。 (3认同)
  • @user253751 我不这么认为。我有一个小型计算集群,它已经 24/7 全天候运行多年(其中一些连续运行了近 10 年)。唯一的停机是由于风扇电机或电容器造成的。没有一个 CPU 出现故障。 (2认同)
  • 无论您的个人数据点如何,过热运行硅都会缩短其使用寿命。举个例子,在加密货币高峰期间购买二手 GPU 有点危险,因为您最终可能会得到一个 100% 运行数月或数年的设备。最显着的影响之一是电迁移,它类似于河流中的水侵蚀。 (2认同)

hob*_*bbs 14

这正常吗?

不,那是非常高的。

CPU硬件本身会控制频率以适应温度吗?

是的,但你不希望这样。进入热节流意味着您从 CPU 获得的性能会低于预期,并且长时间处于高温下会缩短 CPU 的寿命。您想要消除热量,以避免这两个问题。您应该检查您的冷却设置,确保散热器与 CPU 保持良好的热接触(具有足够但不过量的热界面材料)、散热器没有被灰尘堵塞、所有风扇可以运行,并且通过机箱的气流充足。

哦,还要检查一下是否有人破坏了您的系统并安装了加密货币挖矿程序,该挖矿程序将 CPU 和/或 GPU 占用 100% 并使系统变得如此热。

  • _“一个与 CPU 挂钩的加密货币矿工”_ - OP 指出他们在编译代码时看到 100°C,所以我认为这不相关。 (6认同)

A.B*_*A.B 11

相同的sensors命令应该告诉 100\xc2\xb0C 是高温阈值,例如:

\n
Core 0:        +37.0\xc2\xb0C  (high = +100.0\xc2\xb0C, crit = +100.0\xc2\xb0C)\n
Run Code Online (Sandbox Code Playgroud)\n

一旦达到高阈值,除了主动冷却(例如:风扇)之外,还将使用 CPU 可用的其他方法,其中包括降低 CPU 速度:因此 CPU 将达到 100\xc2\xb0C 并保持不变由于负反馈循环。

\n

如果您担心温度,或者更可能对最大风扇速度感到恼火,一些 Intel CPU(至少 Haswell ~ 2013、Skylake 或更高版本)以及相当新的内核(可能>= 5.4))有一个设置人为地添加偏移量以降低温度阈值(高),在该温度阈值时它将开始降低速度。实际上,这意味着 CPU 将达到新选择的温度并保持在该温度,并且风扇需要排出的热量较少,旋转的噪音也较小。当然,构建时间会受到影响。

\n

我找不到正确的子系统符号链接来访问它,因此我找到它的方法如下(每个系统的位置可能会有所不同):

\n
$ find /sys -name tcc_offset_degree_celsius 2>/dev/null \n/sys/devices/pci0000:00/0000:00:04.0/tcc_offset_degree_celsius\n
Run Code Online (Sandbox Code Playgroud)\n

然后以 root 身份:

\n
echo 30 > /sys/devices/pci0000:00/0000:00:04.0/tcc_offset_degree_celsius\n
Run Code Online (Sandbox Code Playgroud)\n

将在 100-30=70\xc2\xb0C 时触发 CPU 减慢效果。您现在会看到核心达到并保持在 70\xc2\xb0C,而不是 100\xc2\xb0C。

\n

sensors除了显示温度现在为 70\xc2\xb0C (确实如此)之外,我不会知道这一点,但我知道内核相关工具turbostat具有有关 TCC 的知识,并且应该是设置温度的首选工具(使用--TCC)如果它支持给定 CPU 的功能(可能意味着它知道要做什么减法)。

\n

  • 这让我想知道OP是否将“high = +100.0°C”混淆为实际温度或类似的东西。 (5认同)

小智 8

在你的具体CPU的情况下根本不正常。确保您的浆糊正确涂抹到 CPU 上并且散热器安装正确。必须接触CPU板面。另请检查您的电脑机箱是否有适当的气流。您还可以运行 htop(sudo install htop) 来查看 CPU 的使用情况以及它是否与高温相关。

  • @marcelm 100°C 只是意味着冷却不足。如果 CPU 的 TDP 为 180W,则必须使用能够分散此功率的冷却系统。而且,由于我们看到 100°C 这样的整数(假设它是正确的),这可能意味着 CPU 正在通过节流主动保持这个温度,这再次表明这种状态是不正常的。 (7认同)
  • @Ruslan 我只是说,对于任何空气冷却解决方案来说,持续 180W 的功率都需要处理很多问题。如果对于那些带有备用冷却器的 CPU,在长时间以涡轮速度运行后进入热节流是正常的,我不会感到惊讶。这已经是笔记本电脑上的常态,而且 Alder Lake 巨大的 TDP 也可能出现在台式机上。当然,如果有更好的冷却解决方案,您可以让 CPU 无限期地处于涡轮增压状态,这很好。但OP现在看到的情况可能仍然很正常。 (2认同)

小智 5

与其他一些答案相反,这是正常的。

根据英特尔 12700K 的 Ark 页面,结温额定为 100C。该处理器已设置为在该温度限制下运行,英特尔认为它是安全的。

也就是说,这并不理想,因为这意味着在处理器散热方面可能存在一些瓶颈。

处理器通常以可变速度运行,并且通常会尝试尽可能快地运行,直到达到 BIOS 中设置的最大速度或最大额定温度。一旦达到这些限制之一,它们将停止更快,甚至可能放慢速度,以免超过温度限制。理想情况下,它们应该在最高温度之前达到最高速度。

据称,保持温度显着降低可以帮助延长零件的使用寿命(我相信这一点,但我也从未见过现代系统的严格数据)

可以采取一些措施来阻止这种情况:

  • 确保机箱风扇安装正确(包括朝向正确的方向)并且机箱通风良好。通风不良的箱子很容易变热。因此,网状前壳在过去几年中变得非常流行。
  • 确保冷却系统正确安装在 CPU 上。范围包括确保风扇安装正确到重新涂抹导热膏
  • 有时,主板没有为 CPU 或机箱提供良好的默认风扇设置。调整“风扇曲线”有时会产生很大的差异(我会在尝试重做导热膏之前这样做)
  • 升级 CPU 上的冷却系统。许多预制件的冷却解决方案都很便宜。
  • 进入系统 BIOS 并降低 CPU 的时钟设置。如果您想要每一点性能,这不一定是理想的选择,但制造商通常会极力推动现代高性能处理器以获得每一点速度以供审查,事实证明,即使速度的微小降低也可能导致用电量大幅下降(进而导致热量输出下降)。

只是强调这一点:即使是主要制造商的预构建系统也可能存在问题。YouTube 上的游戏玩家 Nexus 偶尔会匿名从制造商那里购买预制件,以审查其构建质量。他们见过机箱风扇装反、电缆未完全插入等等。他们甚至有一个先进的 CPU 冷却器,上面有两个面向相反方向的风扇,有效地相互抵消。