相关疑难解决方法(0)

全局不可见的加载说明

由于存储负载转发，某些负载指令能否在全局范围内不可见？换句话说，如果加载指令从存储缓冲区中获取其值，则它永远不必从高速缓存中读取。
通常说来，当从L1D缓存读取负载时，该负载在全局范围内可见，因此，未从L1D读取的负载应使其在全局上不可见。

cpu-architecture memory-barriers cpu-cache

joz*_*joz

lucky-day

3
推荐指数

1
解决办法

297
查看次数

高速缓存一致性操作期间处理器是否停顿

假设变量a = 0

Processor1: a = 1
Processor2: print(a)

Run Code Online (Sandbox Code Playgroud)

Processor1首先执行它的指令，然后在下一个周期中，processor2读取变量以打印它。因此：

Processor2将暂停，直到高速缓存一致性操作完成，它将打印1

P1:   |--a=1--|---cache--coherence---|----------------
P2:   ------|stalls due to coherence-|--print(a=1)---|
time: ----------------------------------------------->

Run Code Online (Sandbox Code Playgroud)

高速缓存一致性操作完成之前，processor2将运行，并且在此之前它将具有陈旧的内存视图。因此它将打印0？
```
P1:   |--a=1--|---cache--coherence---|
P2:   ----------|---print(a=0)---|----
time: ------------------------------->
```
Run Code Online (Sandbox Code Playgroud)
换句话说，在高速缓存一致性操作完成之前，处理器可以拥有过时的内存视图吗？

multithreading caching cpu-architecture cpu-cache

Tri*_*tos

2019 04-02

3
推荐指数

1
解决办法

183
查看次数

不能像 store 一样在 x86 上放宽原子 fetch_add 重新排序，稍后加载？

该程序有时会打印 00，但如果我注释掉 a.store 和 b.store 并取消注释 a.fetch_add 和 b.fetch_add ，它们执行完全相同的操作，即都设置 a=1,b=1 的值，我从不得到00。（在 x86-64 Intel i3 上测试，使用 g++ -O2）

我是不是遗漏了什么，或者按照标准“00”永远不会出现？

这是带有普通商店的版本，可以打印00。

// g++ -O2 -pthread axbx.cpp  ; while [ true ]; do ./a.out  | grep "00" ; done
#include<cstdio>
#include<thread>
#include<atomic>
using namespace std;
atomic<int> a,b;
int reta,retb;

void foo(){
        //a.fetch_add(1,memory_order_relaxed);
        a.store(1,memory_order_relaxed);
        retb=b.load(memory_order_relaxed);
}

void bar(){
        //b.fetch_add(1,memory_order_relaxed);
        b.store(1,memory_order_relaxed);
        reta=a.load(memory_order_relaxed);
}

int main(){
        thread t[2]{ thread(foo),thread(bar) };
        t[0].join(); t[1].join();
        printf("%d%d\n",reta,retb);
        return 0;
}

Run Code Online (Sandbox Code Playgroud)

下面从不打印 00