ECC内存的重要性

PJK*_*PJK 11 hardware ecc dedicated-server

ECC 内存模块在非关键服务器上是否重要?

我正在考虑给自己一个玩具专用服务器,用于许多随机的、非关键的东西。零星的重启没什么大不了的。我正在寻找一家供应商,但价格非常便宜。他们的硬件对于任何严肃的服务器盒来说都是一个笑话:台式机处理器、非 ECC RAM、杂牌机箱、没有热插拔 SATA 硬盘等(嗯,我猜价格是合理的)。

我认为 ECC 内存在任何“严肃的”服务器上都是理所当然的,所以我想知道这对于“玩具”设备来说是否重要。

Hub*_*rio 11

CERN IT 人员发布的数据(数据完整性)表明来自 RAM 的错误数量非常低。您仍然需要权衡数据和硬件成本。

您可以在StorageMojo 上阅读更多有关此内容的信息。


Ben*_*nGC 10

ECC RAM 基本上有助于防止从 RAM 读取和写入时发生的错误。实际出现错误的可能性很小,但不为零。我会说,如果你不做关键任务的东西,你可以在没有 ECC RAM 的情况下逃脱——就像我说的那样,遇到 ECC 可以防止的错误的可能性非常非常小。


mic*_*ele 6

什么是非关键服务器?一个可以失败的?

ECC RAM是根本当内存的可靠性是至关重要的。

两件事随着内存大小的增长而增长:

  • 软件对内存的依赖,尤其是。服务器软件(例如缓存)
  • 内存错误的概率(p = num_bits * p_bit_failure)

这份关于 ECC 的英特尔报告报告了以下事实:

  • 24x7 运行的 4GB 内存服务器的平均内存错误率为每年 150 次
  • 每个内存模块每年约 4000 个可纠正错误
  • 超频和系统老化大大增加故障率
  • 反复出现故障很常见并且很快发生(97% 发生在第一次故障后的 10 天内)=> 雪崩效应
  • 对于使用寿命为 3 至 5 年的 ECC 服务器,系统故障不可纠正的内存错误的几率小于 0.001%

WISC最近的另一项研究表明 ECC 对于这些 ZFS 系统至关重要:

ZFS 对内存损坏没有预防措施:坏数据块返回给用户或写入磁盘,文件系统操作失败,多次整个系统崩溃。

需要注意的是,其他文件系统对这种形式的数据损坏与 ZFS 一样敏感。

在可能的情况下,ECC 可以让您免于遇到这些问题,在灾难性的情况下,它会在为时已晚之前向您发出警告。