CPU 输入电压、核心温度和风扇速度突然和永久性增加,而负载没有相应增加

Ale*_*exD 5 hardware

我的一台服务器显示其监控参数发生了奇怪的变化。上周日晚上,电压测量值之一(我认为是Vcore 的in0)突然平均从 ~1V 增加到 ~1.20V 20%。报告的 CPU 核心温度和 CPU 风扇速度相应显着增加,但 CPU 频率(1.20GHz -> 1.25GHz)和 CPU 基本负载略有增加。

这意味着什么?我怀疑 PSU 或 MB 出现故障。对于这种行为还有其他好的解释吗?此时服务器硬件、BIOS 设置或软件没有任何变化。

服务器 MB 是带有 AMD Athlon(tm) 双核处理器 4450e 的 Gigabyte GA-MA69VM-S2。操作系统是带有内核 3.2.0-45-generic 的 Ubuntu 12.04.2 LTS。监控由 lm-sensors 1:3.3.1-2ubuntu1 完成。传感器命令的当前输出如下图所示。

电压 温度 CPU风扇 CPU频率 CPU负载

k8temp-pci-00c3
Adapter: PCI adapter
Core0 Temp:   +38.0°C  
Core0 Temp:   +35.0°C  
Core1 Temp:   +35.0°C  
Core1 Temp:   +37.0°C  

it8716-isa-0228
Adapter: ISA adapter
in0:          +1.20 V  (min =  +0.00 V, max =  +4.08 V)
in1:          +1.89 V  (min =  +0.00 V, max =  +4.08 V)
in2:          +3.36 V  (min =  +0.00 V, max =  +4.08 V)
+5V:          +2.98 V  (min =  +0.00 V, max =  +4.08 V)
in4:          +3.07 V  (min =  +0.00 V, max =  +4.08 V)
in5:          +3.23 V  (min =  +0.00 V, max =  +4.08 V)
in6:          +0.10 V  (min =  +0.00 V, max =  +4.08 V)
5VSB:         +3.02 V  (min =  +0.00 V, max =  +4.08 V)
Vbat:         +3.02 V  
fan1:        1555 RPM  (min =    0 RPM)
fan2:        2860 RPM  (min =    0 RPM)
temp1:        +29.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermistor
temp2:        +34.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermistor
temp3:        +31.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermal diode
cpu0_vid:    +1.200 V
intrusion0:  ALARM
Run Code Online (Sandbox Code Playgroud)

Cho*_*er3 4

良好的数据/研究等,它看起来确实像你所建议的那样,有些东西迫使 vcore 上升了 .2v - 不知道为什么,但之后的一切都遵循这种模式 - 大概你没有多余的 CPU 可以切换出去看看是芯片的问题还是VRM的问题?这就是我真正建议的,将问题分开,看看问题是否仍然存在。