RAM故障统计

Car*_*org 8 memory

有谁知道有关计算机 RAM 出现故障的频率的任何统计数据或研究?

更新:我的电脑很好!我没有内存问题,我对统计感兴趣。我收到了关于我的软件的错误报告,其中一个原因可能是用户计算机上的 RAM 出现故障,我想知道这种可能性有多大。

谢谢!

卡尔

Dav*_*ney 6

在服务器级别为 36 的机器群中,我看到ECC 电路每 3 个月检测一次可纠正的故障。

如果您怀疑内存故障,您应该运行memtest86,现在几乎每个流行的 linux 发行版都包含它。


Car*_*org 3

来自 Robin Harris 的DRAM 错误率:DIMM 街上的噩梦

\n\n
\n

对数十万台 Google 服务器上的 DRAM 进行了两年半的研究发现,\n DIMM 错误率比想象的高出数百到\n 数千倍\n xe2\x80\x94 平均为 3,751 个可纠正的错误率\n 每个 DIMM 每年出现错误。

\n
\n\n

哈里斯引用了一项历时 2.5 年对 Google 服务器群进行的研究。请注意,服务器通常使用 EEC RAM,它可以执行一些错误纠正。消费级计算机通常没有这个。

\n\n

Lambda Diode 的 Berke Durak计算得出

\n\n
\n

首先,我们假设您的系统\n 没有纠错或奇偶校验。\n 在时间 T 期间遇到\n 位错误的概率为\n 1-(1-p) ^米。

\n\n

对于 T=1 小时,p = 1.3e-12 和 m =\n 4*2^30*8 给出 0.044 或 4.4% 。\n 这是相当高的概率。\n 事实上,在一天之内,这导致概率为 66%,72 小时内概率为 96%。

\n\n

因此,地球海平面上的 4 GB 内存在 72 小时内出现至少 1 位错误的概率超过 95%。

\n
\n\n

下次当我们无法确定坠机原因时,如果同事说“宇宙射线”,我就不会笑了……

\n

  • “20% 的错误机器占所有观察到的错误的 90% 以上”,“研究发现错误率与主板相关”。我想我暂时会坚持传统观点。这项研究充满了“谎言、该死的谎言和统计数据”的味道。(只是我的2分钱) (2认同)