小编iMr*_*lix的帖子

内存模型/缓存一致性协议:TSO 如何与 MESIF 结合使用

刚刚学完系统的编程讲座材料后,我偶然发现了内存模型以及缓存一致性协议的关键概念。尽管它们作为独立概念是有意义的,但尚不清楚它们如何结合在一起。具体来说,在查看 x86 时,我正在使用强制执行 TSO 内存模型的 ISA,以及使用 MESIF 缓存一致性协议的 CPU(对于 Intel)。

\n\n

一开始,教授引入了缓存一致性协议,作为确保芯片中任何核心都访问一个大的单片内存块的手段。然后,在结束了缓存一致性之后,他继续研究内存模型,特别是 TSO(我们已经在并行编程课程中介绍了线性化/顺序一致性)。以下是直接引用有关 x86 内存模型的讲座材料:

\n\n
\n
    \n
  • 64 位 x86 处理器的标准\n \n
      \n
    • 有时称为总商店订购 (TSO)
    • \n
    • 早期的 32 位 x86 实现的 PRAM \xe2\x80\x93 较弱!
    • \n
  • \n
  • 写入读取放宽:稍后的读取可以绕过早期的写入\n \n
      \n
    • 所有处理器都按照发出的顺序查看来自一个处理器的写入。
    • \n
    • 处理器可以看到来自不同处理器的不同写入交错。
    • \n
  • \n
\n
\n\n

似乎我们通过在缓存层次结构中引入(又一个)层,即(有序的)存储缓冲区,“解决”了缓慢的顺序一致性问题。\n对我来说,TSO 似乎与缓存一致性的原则正交。我们非常努力地让我们的缓存匹配,只是在两者之间添加了未被缓存一致性覆盖的另一层。

\n\n

问题:

\n\n
    \n
  1. 为什么存储缓冲区没有被缓存一致性协议覆盖?是否假设从存储缓冲区写回 L1 的速度如此之快,以至于在大多数情况下中间写回导致的不一致不会成为问题?(即我认为存储缓冲区 -> L1 传输只需要几个周期,因此一旦 L1 接收到数据,它就会通过总线发送一个事务,告诉其他核心使其副本无效)
  2. \n
  3. 我应该如何看待缓存一致性和内存模型这两个概念?按照我的理解,内存模型是我们想要的理论概念,而缓存一致性是实现所述模型的实际实现的一部分。
  4. \n
\n\n

提前非常感谢您的澄清!

\n\n

最好,\n菲利克斯

\n

architecture caching system memory-model

5
推荐指数
1
解决办法
741
查看次数

结构与数组的对齐规则冲突

正如标题所暗示的,问题是关于Linux 上 x86-64 中聚合类型的对齐

在我们的讲座中,教授介绍了结构(及其元素)与附加幻灯片的对齐方式。因此,我会假设(根据维基百科和其他讲座材料)对于任何聚合类型,对齐是根据其最大成员。不幸的是,在以前的考试问题中似乎并非如此,它说:

“假设每个页表 [4kB,每个 PTE 64b] 都存储在内存中一个“自然对齐”的物理地址(即一个表大小的整数倍的地址),......”

为什么对于页表(它基本上是内存中的 8 字节值的数组),对齐规则不是根据最大的元素,而是根据整个表的大小?

非常感谢澄清!
菲利克斯 讲座幻灯片

x86 struct memory-alignment page-tables

2
推荐指数
1
解决办法
113
查看次数