RHEL:当内存开始出现故障时会发生什么?

eth*_*nny 4 memory redhat

我从某些服务器 RAM 收到 ecc 警告。这是一台很旧的机器,所以这些零件没有任何保修。

如果这是 Windows,我希望看到 BSOD。

我可以从 RH5.x 中得到什么?

eww*_*ite 5

在 RHEL 系统上,您会在内核环形缓冲区输出 ( dmesg) 以及/var/log/messages. 一旦超过 ECC 阈值,应用程序可能会崩溃。服务器可以热启动。你可能有内核恐慌。机器检查异常日志会有指标。我什至见过系统重新启动并禁用坏 DIMM 的情况。

如果这是企业服务器硬件,系统的事件日志可能会填满错误。服务器的看门狗可能会超时并强制系统冷启动。

在这一点上,您知道您遇到了问题……所以正确的解决方案是更换坏的 DIMM。在大多数情况下,故障模式并不漂亮,因此最好避免这种痛苦。很高兴 ECC RAM 给了你警告。