最大的数据类型,可以原子获取-ANDed?

use*_*112 4 c++ vector atomic avx

我想尝试使用以下内容原子重置256位:

#include <x86intrin.h>
#include <iostream>
#include <array>
#include <atomic>

int main(){

    std::array<std::atomic<__m256i>, 10> updateArray;

    __m256i allZeros = _mm256_setzero_si256();

    updateArray[0].fetch_and(allZeros);
}
Run Code Online (Sandbox Code Playgroud)

但我得到关于没有的元素的编译器错误fetch_and().这是不可能的,因为256位类型太大而不能保证原子性?

有没有其他方法可以实现这个?我正在使用GCC.

如果没有,我可以原子复位64位的最大类型是什么?

编辑:任何AVX指令可以原子地执行fetch-AND吗?

Mat*_*son 5

所以有一些不同的事情需要解决:

  1. 处理器可以做什么?
  2. 我们原子意味着什么?
  3. 你能让编译器生成处理器可以执行的代码吗?
  4. C++ 11/14标准支持吗?

对于#1和#2:

在x86中,有指令可以执行8,16,32,64,128,256和512位操作.一个处理器[至少如果数据与它自己的大小对齐]将以原子方式执行该操作.但是,对于"真正的原子"操作,它还需要防止更新数据中的竞争条件[换句话说,阻止某些其他处理器读取,修改和写回相同的位置].除了少量的"隐含锁定"指令之外,这是通过向特定指令添加"锁定前缀"来完成的 - 这将对系统中的其他处理器执行正确类型的缓存 - 技术术语以确保只有这个处理器可以更新这些数据.

我们不能使用带有LOCK前缀的VEX指令(来自英特尔的手册)

在VEX之前具有LOCK前缀的任何VEX编码指令将为#UD

您需要一个VEX前缀来使用AVX指令,而#UD表示"未定义指令" - 换句话说,如果我们尝试执行它,代码将导致处理器异常.

因此,100%确定处理器不能一次对256位进行原子操作.这个答案讨论了SSE指令的原子性: SSE指令:哪些CPU可以进行原子16B内存操作?

如果指令无效,#3就没有意义了.

#4 - 好吧,标准支持std::atomic<uintmax_t>,如果uintmax_t恰好是128或256位,那么你当然可以做到这一点.我不知道任何支持128位或更高位的处理器uintmax_t,但语言并不能阻止它.

如果"原子"的要求不如"需要确保100%肯定没有其他处理器同时更新",那么使用常规SSE,AVX或AVX512指令就足够了 - 但是会有竞争条件如果你有两个处理器(内核)同时对同一位内存进行读/修改/写操作.

在x86上最大的原子操作是CMPXCHG16B,如果两个其他寄存器中的值与内存中的值匹配,它将把两个64位整数寄存器与内存中的内容交换.所以你可以想出一些东西,它读取一个128位值,然后输出一些内容,然后如果没有其他内容首先将原始值存回原来 - 如果发生这种情况,你必须重复操作,当然,它也不是单一的原子和操作.

当然,在除Intel和AMD之外的其他平台上,行为可能会有所不同.