RAM 测试不一致 - 最有可能的罪魁祸首是什么?(即我应该花钱更换什么)

fdm*_*ion 20 memory hardware-failure

  • 主板:GA-B85M-DS3H-A
  • CPU:酷睿i5 4430
  • 内存:PNY XLR8 DDR3 32GB (4x8GB) 1600MHz (MD32768K4D3-1600-X9)
  • 电源:EVGA 500 W1 80+

问题

安装所有 32GB 内存后,系统始终无法通过 MemTest86+ 6.2。失败总是发生在第一次通过时,错误迅速上升到数百万个错误。尝试运行 Windows 会导致随机重新启动和停止错误(正如预期的 RAM 错误)。

我试过的

  • 测试插槽 DIMM1 中的单个 8GB PNY 模块。成功完成 4 次 MemTest。
  • 测试插槽 DIMM2 中的单个 8GB PNY 模块。成功完成 4 次 MemTest。
  • 测试插槽 DIMM3 中的单个 8GB PNY 模块。成功完成 4 次 MemTest。
  • 测试插槽 DIMM4 中的单个 8GB PNY 模块。成功完成 4 次 MemTest。
  • 在插槽 DIMM1 中分别测试所有四个 8GB PNY DIMM。所有模块都成功完成了 4 次 MemTest。
  • 测试插槽 DIMM1 和 DIMM2 中的两个 8GB PNY 模块。成功完成 4 次 MemTest。
  • 测试插槽 DIMM3 和 DIMM4 中的两个 8GB PNY 模块。成功完成 4 次 MemTest。
  • 在所有插槽中使用四个 2GB 已知良好的 DIMM 测试主板。成功完成 4 次 MemTest。
  • 交换插槽中 PNY DIMM 的顺序。没有变化 - MemTest 错误仍然发生。
  • 将主板 RAM 电压从 1.5v 提高到 1.65V。没有变化 - MemTest 错误仍然发生。
  • 在设置实用程序中使用 RAM 手动设置的各种组合 - 启用/禁用 XMP 配置文件、设置“增加稳定性”预设等。没有变化,MemTest 错误仍然发生。

我想我可以安全地排除坏 RAM 和坏 RAM 插槽。该唯一的MemTest这个测试失败的时间,如果所有四个8GB模块同时安装。

我已经测量了来自 PSU 的电压,即使安装了所有四根棒,那里的一切看起来都很稳定。

在撰写本文时,我尝试了最后的选择,即在 BIOS 中手动将 RAM 速度降低到 1066MHz。到目前为止,MemTest 已经完成了一次通过,并且没有错误地进行了第二次。(以上所有测试均以原生 1600MHz RAM 速度执行。)这可能允许我使用系统,尽管 RAM 速度稍慢,但这似乎不是永久修复。

每当 MemTest 错误发生时,它们总是发生在 64 位地址总线上的相同位置:

Bit Error Mask: 00000000FF000000
Run Code Online (Sandbox Code Playgroud)

此外,错误绝不会发生在 4GB 以下。换句话说,所有错误都发生在 4GB 和 32GB 之间的地址空间中。

我推断这是 CPU、RAM 和主板的某种奇怪的交互或时序问题,因为错误非常一致,只发生在一种特定配置中,似乎可以通过降低 RAM 的速度来缓解,并且只发生在 4GB 以上。我的问题是:我的 CPU 或主板更有可能是罪魁祸首吗?

我一直打算将这台机器升级到 Core i7-4790K,所以如果 CPU 可能是罪魁祸首(我知道内存控制器在这些较新型号的 CPU 上)那么效果很好,因为我打算升级无论如何,但我想知道主板本身是否也可能是问题的一部分。即我不想在 i7 CPU 上花钱只是为了遇到完全相同的问题并发现我还必须更换主板......

建议?


编辑:较慢的 RAM 速度仍然会产生错误,但只有在测试达到第三遍时才会产生错误。我在只有一个 CPU 处于活动状态的情况下重新启动了测试,只是为了测试 CPU 本身的交互。

Ben*_*igt 18

这听起来不像任何组件有缺陷,而是您使用的是不兼容的组合。

在同一条内存总线上安装多个插槽会增加每条数据线上的电容并减慢上升时间,这会导致转换延迟到达并被误检测。这种现象被电气工程师称为“扇出”。

由于内存模块内部的扇出,这更加复杂。模块上 DRAM 设备的数量和拓扑结构称为“等级”,将影响您可以成功并行连接的模块数量。

支持大量内存插槽的服务器主板实际上需要缓冲内存,它使用级联缓冲区网络来限制每个人看到的扇出(以及电容)。缓冲器本身会导致延迟,但它只会随着负载数量呈对数增加,而对于未缓冲的存储器电容则呈线性增加。

维基百科对此进行了讨论:https : //en.wikipedia.org/wiki/Memory_rank

一些主板手册实际上称这种事情。对于其他人,您可以从 RAM 兼容性列表中推断出信息。例如,华硕 Z170-A 主板显示双列(在手册中称为 DS = 双面)只能在该板上的两个插槽中一次使用,而不是一次使用四个单列 DIMM 的能力.

在此处输入图片说明

  • @bwDraco:即使内存控制器在 CPU 上,主板也很重要。PCB 布局会影响它,次优长度匹配会降低信号的相位裕度(这也是错误与某些字节或位位置相关的原因)。主板说明书不讲排位并不代表所有的组合都支持,只是说明它是一本没有详细说明的废话手册。 (2认同)

bwD*_*aco 9

这听起来像是处理器的集成内存控制器中的问题

在现代系统中,除了提供内存模块和处理器之间的路径之外,主板在内存管理中并没有真正发挥作用。内存直接连接到处理器,以最大限度地减少延迟;在旧系统中将内存连接到处理器的“北桥”现在是处理器本身的一部分。(固件或 PCH 可以控制处理器如何运行 RAM,但它导致您描述的那种位错误是没有意义的,因为它最终是处理器的责任。)因此,我的第一件事d 在这种情况下怀疑是 IMC 有问题。

事实上,如果主板或系统固件是您遇到的问题的罪魁祸首,我会感到非常惊讶。

  • @Michael:弯曲的引脚也会导致测试单个模块失败。 (6认同)

小智 4

我看到一些对该主板上的 BIOS 的差评。我首先检查 BIOS 更新。永远不要吝惜主板。