自动memtest然后开机

r00*_*00f 4 linux boot memory

有什么方法可以重新启动服务器,因此它运行 memtest(例如,1 或 2 次传递),然后重新启动回 Linux 并将报告写入某个日志?

Windows Server 2012 中的此功能帮助我多次诊断远程服务器上的 RAM 问题,但我无法通过谷歌搜索 Linux 服务器。

小智 6

Linux 可以做得比这更好 - 有一个内核命令行选项来测试整个内存作为启动序列的一部分并锁定坏块 - 必要时,这增加几分钟的启动序列,其中框似乎没有响应。(memtest=n 标志 - 请参阅https://www.kernel.org/doc/Documentation/admin-guide/kernel-parameters.txt

一旦你知道坏块在哪里,你就可以告诉 linux 使用 badram= 标志避免它们。

还有一个在线内存测试测试器(man memtester),你也可以直接查看你的 IPMI(它应该在任何半体面的服务器上标记任何错误——在我的英特尔服务器上,任何 ipmi 发现的 ECC 错误都已写入系统日志)