Dan*_*Dan 6 c cpu cpu-architecture cpu-cache
在 C 等语言中,不同线程对同一内存位置的不同步读取和写入是未定义的行为。但在 CPU 中,缓存一致性表示,如果一个核心写入某个内存位置,然后另一个核心读取它,则另一个核心必须读取写入的值。
如果上一层将丢弃内存层次结构的连贯抽象,为什么处理器需要费心暴露它呢?为什么不让缓存变得不连贯,并要求软件在想要共享某些内容时发出特殊指令呢?
Pet*_*des 11
acquire如果没有一致release的缓存,C++11 所需的and语义std::mutex(以及其他语言中的等效项,以及早期的东西,如)的实现成本pthread_mutex将非常昂贵。如果不能依靠硬件使您的存储可见并让您的存储可见,那么您必须在每次释放锁时写回每条脏行,并在每次获取锁时逐出每条干净行。加载不会从私有缓存中获取陈旧数据。
但对于缓存一致性,获取和释放只是命令该核心访问其自己的私有缓存的问题,该缓存与其他核心的 L1d 缓存属于同一一致性域的一部分。因此它们是本地操作并且非常便宜,甚至不需要耗尽存储缓冲区。互斥锁的成本仅在于它需要执行的原子 RMW 操作,当然,如果拥有互斥锁的最后一个核心不是这个核心,当然还包括缓存未命中。
\nC11 和 C++11 分别添加了 stdatomic 和 std::atomic,这使得访问共享_Atomic int变量得到了明确的定义,因此高级语言不公开这一点是不正确的。假设可以在需要显式刷新/无效以使存储对其他核心可见的机器上实现,但这会非常慢。语言模型假设一致的缓存,不提供显式的范围刷新,而是具有释放操作,使每个较旧的存储对于执行与该线程中的释放存储同步的获取加载的其他线程可见。(请参阅何时在多线程中使用易失性?进行一些讨论,尽管该答案主要是揭穿缓存可能包含陈旧数据的误解,但人们因编译器可以“缓存”非原子非易失性值而感到困惑在寄存器中。)
事实上,C++ 原子性的一些保证实际上被标准描述为向软件公开硬件一致性保证,例如“写读一致性”等,并以注释结尾:
\n\n\nhttp://eel.is/c++draft/intro.races#19
\n[注意:前面的四个一致性要求实际上不允许编译器将原子操作重新排序到单个对象,即使这两个操作都是宽松加载。这有效地使大多数硬件提供的缓存一致性保证可用于 C++ 原子操作。\xe2\x80\x94 尾注
\n
(早在 C11 和 C++11 之前,SMP 内核和一些用户空间多线程程序就采用手动原子操作,使用 C11 和 C++11 最终以可移植方式公开的相同硬件支持。)
\n此外,正如评论中指出的那样,一致的缓存对于其他核心对同一行的不同部分进行写入时不互相干扰至关重要。
\nISO C11 保证一个线程char arr[16]可以arr[0]在另一个线程写入时进行写入arr[1]。如果它们都在同一高速缓存行中,并且该行存在两个冲突的脏副本,则只有一个可以“获胜”并被写回。 C++ 内存模型和 char 数组上的竞争条件
ISO C 实际上要求char在不干扰周围字节的情况下可以写入的最小单元一样大。在几乎所有机器上(不是早期 Alpha 和某些 DSP),这都是单字节,即使与某些非 x86 ISA 上的对齐字相比,字节存储可能需要额外的周期才能提交到 L1d 缓存。
该语言直到 C11 才正式要求这样做,但这只是标准化了“每个人都知道”唯一明智的选择,即编译器和硬件已经如何工作。
\n| 归档时间: |
|
| 查看次数: |
809 次 |
| 最近记录: |