CPU 或 RAM 出现硬件错误,该怎么办?

Ear*_*asi 0 hardware memory central-processing-unit

我有一台服务器,它时不时地向操作系统报告硬件错误,但在其他方面运行时没有任何明显的问题。

今天我在经过它附带的显示器时发现了这一点。在此输入图像描述

谁能告诉我这是什么意思?这是我需要担心的事情吗?是否有我可以更深入查看的日志文件?几周前,我注意到系统未检测到其中一根 RAM 棒,它仅报告 112 GB,而不是 128 GB。现在它显示正确了。

有关更多信息,该服务器具有以下主要组件:

  • 超微 MBD-H11DSi-NT-B
  • 2 个 AMD 霄龙 7301
  • 128GB 金士顿服务器 Premier KSM26RD8/16HAI DDR4-2666 regECC
  • Unraid 作为操作系统

use*_*517 5

谁能告诉我这是什么意思?

您有一个需要解决的硬件问题 - 可能是内存问题。输入MC15_STATUS[Over|CE谷歌,第二次点击来自unraid论坛,这可能对我也有帮助。

这是我需要担心的事情吗?

绝对地!忽略硬件错误将给您(数据)带来风险。我会让该系统停止生产,而无需花时间在互联网上询问这是否是我需要担心的问题。

使用 memtest86 之类的工具来测试和诊断问题的位置。