Dan*_*ica 6 c++ x86-64 atomic openmp memory-fences
根据OpenMP规范(v4.0),由于不同步的读/写,以下程序包含可能的数据争用i:
int i{0}; // std::atomic<int> i{0};
void write() {
// #pragma omp atomic write // seq_cst
i = 1;
}
int read() {
int j;
// #pragma omp atomic read // seq_cst
j = i;
return j;
}
int main() {
#pragma omp parallel
{ /* code that calls both write() and read() */ }
}
Run Code Online (Sandbox Code Playgroud)
我想到的可能解决方案在代码中显示为注释:
i带#pragma omp atomic write/read,i带#pragma omp atomic write/read seq_cst,std::atomic<int>而不是int作为一种类型i.以下是x86_64上编译器生成的指令(-O2在所有情况下):
GNU g++ 4.9.2: i = 1; j = i;
original code: MOV MOV
#pragma omp atomic: MOV MOV
// #pragma omp atomic seq_cst: MOV MOV
#pragma omp atomic seq_cst: MOV+MFENCE MOV (see UPDATE)
std::atomic<int>: MOV+MFENCE MOV
clang++ 3.5.0: i = 1; j = i;
original code: MOV MOV
#pragma omp atomic: MOV MOV
#pragma omp atomic seq_cst: MOV MOV
std::atomic<int>: XCHG MOV
Intel icpc 16.0.1: i = 1; j = i;
original code: MOV MOV
#pragma omp atomic: * *
#pragma omp atomic seq_cst: * *
std::atomic<int>: XCHG MOV
* Multiple instructions with calls to __kmpc_atomic_xxx functions.
Run Code Online (Sandbox Code Playgroud)
我想知道为什么GNU/clang编译器不会为#pragma omp atomic写入生成任何特殊指令.我期待类似的指令std::atomic,即,MOV+MFENCE或者XCHG.任何解释?
UPDATE
克++ 5.3.0产生MFENCE对#pragma omp atomic write seq_cst.我相信这是正确的行为.没有seq_cst,它产生平原MOV,这足以用于非SC原子性.
我的Makefile中有一个错误,g ++ 4.9.2也MFENCE为CS原子写入产生了错误.对不起,伙计们.
Clang 3.5.0没有实现OpenMP SC原子,感谢Hristo Iliev指出这一点.
有两种可能性。
编译器没有义务将包含数据竞争的 C++ 代码转换为错误的机器代码。根据机器内存模型,通常使用的指令可能已经是原子的和连贯的。将相同的 C++ 代码应用到另一个体系结构中,您可能会开始看到编译指示会导致 x86_64 上不存在的差异。
除了可能导致使用不同的指令和/或额外的内存栅栏指令之外,原子编译指示(以及std::atomic和volatile)还限制编译器自己的代码重新排序优化。它们可能不适用于您的简单情况,但您当然可以看到公共子表达式消除(包括在循环外提升计算)可能会受到影响。
| 归档时间: |
|
| 查看次数: |
436 次 |
| 最近记录: |