num ++是'int num'的原子吗？

Question

num ++是'int num'的原子吗？

Leo*_*aar 148 c c++ assembly multithreading atomic

一般地,对于int num,num++(或++num),作为读-修改-写操作中,是不是原子.但我经常看到编译器,例如GCC,为它生成以下代码(在这里尝试):

由于第5行对应于num++一条指令,我们可以得出结论,在这种情况下num++ 是原子的吗？

如果是这样,是否意味着如此生成num++可以在并发(多线程)场景中使用而没有任何数据争用的危险(例如,我们不需要制作它,std::atomic<int>并强加相关成本,因为它是无论如何原子)？

UPDATE

请注意,这个问题不是增量是否是原子的(它不是,而且是问题的开头行).它是否可以在特定场景中,即在某些情况下是否可以利用单指令性质来避免lock前缀的开销.而且,作为公认的答案约单处理器的机器,还有部分提到这个答案,在其评论和其他人谈话解释,它可以(尽管不是C或C++).

Answer 1

Pet*_*des 187

这绝对是C++定义为导致未定义行为的数据争用的原因,即使一个编译器碰巧产生了在某些目标机器上执行了您所希望的代码.您需要使用std::atomic可靠的结果,但memory_order_relaxed如果您不关心重新排序,则可以使用它.请参阅下面的一些示例代码和asm输出fetch_add.

但首先,汇编语言部分问题:

由于num ++是一个指令(add dword [num], 1),我们可以得出结论,在这种情况下num ++是原子的吗？

内存目标指令(纯存储除外)是在多个内部步骤中发生的读 - 修改 - 写操作.没有修改架构寄存器,但CPU必须在内部保存数据,同时通过其ALU发送数据.即使是最简单的CPU,实际的寄存器文件也只是数据存储的一小部分,锁存器将一级的输出保持为另一级的输入,等等.

来自其他CPU的内存操作可以在加载和存储之间全局可见.即add dword [num], 1在循环中运行的两个线程将踩到彼此的商店.(参见@Margaret的答案,获得一张漂亮的图表).从两个线程中的每个线程增加40k后,计数器可能仅在实际多核x86硬件上增加了大约60k(而不是80k).

"原子",来自希腊语,意思是不可分割的,意味着没有观察者可以看到操作作为单独的步骤.对于所有位同时发生物理/电气瞬间发生只是实现负载或存储的一种方法,但这对于ALU操作来说甚至都不可能.我在x86上对Atomicity的回答中详细介绍了纯负载和纯存储,而这个答案主要集中在read-modify-write.

的lock前缀可以被应用于许多读-修改-写(存储目的地)的指令,以使整个操作原子与系统中的相对于所有可能的观察者(其它内核和DMA设备,而不是挂在CPU针脚示波器).这就是它存在的原因.(另见本问答).

原子lock add dword [num], 1 也是如此.运行该指令的CPU内核将使高速缓存行在其私有L1高速缓存中保持固定状态,从加载时从高速缓存读取数据,直到存储将其结果提交回高速缓存.根据MESI缓存一致性协议(或多核AMD使用的MOESI/MESIF版本)的规则,这可以防止系统中的任何其他缓存在从加载到存储的任何点都拥有缓存行的副本.分别是英特尔CPU).因此,其他核心的操作似乎发生在之前或之后,而不是在此期间.

如果没有lock前缀,另一个核心可以获取缓存行的所有权并在我们加载之后但在我们的商店之前修改它,以便其他商店在我们的加载和存储之间变得全局可见.其他几个答案都是错误的,声称没有lock你会得到相同缓存行的冲突副本.在具有连贯缓存的系统中永远不会发生这种情况.

(如果locked指令对跨越两个缓存行的内存进行操作,则需要做更多的工作才能确保对象的两个部分的更改在传播到所有观察者时保持原子性,因此没有观察者可以看到撕裂.CPU可能必须锁定整个内存总线,直到数据到达内存.不要错位你的原子变量!)

请注意,lock前缀还将指令转换为完整的内存屏障(如MFENCE),停止所有运行时重新排序,从而提供顺序一致性.(请参阅Jeff Preshing的优秀博客文章.他的其他帖子也非常出色,并清楚地解释了很多关于无锁编程的好东西,从x86和其他硬件细节到C++规则.)

在单处理器机器上,或在单线程进程中,单个RMW指令实际上是原子的,没有lock前缀.其他代码访问共享变量的唯一方法是让CPU执行上下文切换,这不能在指令中间发生.因此,plain dec dword [num]可以在单线程程序与其信号处理程序之间或在单核机器上运行的多线程程序之间进行同步.请参阅我对另一个问题的答案的后半部分以及其中的评论,我将在其中更详细地解释这一点.

回到C++:

在num++没有告诉编译器你需要它编译成单个读 - 修改 - 写实现的情况下使用它是完全虚假的:

;; Valid compiler output for num++
mov   eax, [num]
inc   eax
mov   [num], eax

归档时间：	9 年，1 月前
查看次数：	12876 次
最近记录：	6 年，8 月前

num ++是'int num'的原子吗？

回到C++:

不要将目标内存模型(x86)与C++内存模型混淆

更多信息