相关疑难解决方法(0)

从 Intel 的 Sandy Bridge 开始，空间预取器现在一次提取成对的 64 字节缓存线，因此我们必须对齐到 128 字节而不是 64。

资料来源：

https://www.intel.com/content/dam/www/public/us/en/documents/manuals/64-ia-32-architectures-optimization-manual.pdf

https://github.com/facebook/folly/blob/1b5288e6eea6df074758f877c849b6e73bbb9fbb/folly/lang/Align.h#L107

我在英特尔的手册中没有找到这样的说法。但直到最新的提交，folly仍然使用 128 字节填充，这让我很有说服力。所以我开始编写代码来看看是否可以观察到这种行为。这是我的代码。

#include <thread>

int counter[1024]{};

void update(int idx) {
    for (int j = 0; j < 100000000; j++) ++counter[idx];
}

int main() {
    std::thread t1(update, 0);
    std::thread t2(update, 1);
    std::thread t3(update, 2);
    std::thread t4(update, 3);
    t1.join();
    t2.join();
    t3.join();
    t4.join();
}

Run Code Online (Sandbox Code Playgroud)

编译器资源管理器

我的CPU是锐龙3700X。当索引为0、1、2、3时，大约需要 1.2 秒才能完成。当索引为0, 16, 32,时 …

c++ x86-64 rust cpu-cache false-sharing

Qua*_*Cat

2022 05-05

15
推荐指数

1
解决办法

2210
查看次数

现代x86实现可以从多个先前的商店中存储转发吗？

如果负载与两个早期存储重叠(并且负载未完全包含在最早的存储中),现代Intel或AMD x86实现是否可以从两个存储转发以满足负载？

例如,请考虑以下顺序:

mov [rdx + 0], eax
mov [rdx + 2], eax
mov ax, [rdx + 1]

Run Code Online (Sandbox Code Playgroud)

最后的2字节加载从前一个存储区获取其第二个字节,但是它之前的存储区的第一个字节.这个负载可以存储转发,还是需要等到两个先前的存储都提交给L1？

请注意,通过存储转发,我包括任何可以满足仍然存储在缓冲区中的存储的读取的机制,而不是等待它们提交到L1,即使它是一个比最好的情况"转发"更慢的路径.单店"案例.

optimization performance x86 assembly micro-optimization

Bee*_*ope

2017 09-12

9
推荐指数

2
解决办法

688
查看次数

英特尔硬件上的商店缓冲区大小？什么是商店缓冲区？

在英特尔优化手册似乎对存储缓冲区的数量存在于处理器的许多地方,但谈判没有谈存储缓冲区的大小.这是公共信息还是商店缓冲区的大小保留为微架构细节？

我正在研究的处理器主要是Broadwell和Skylake,但其他人的信息也不错.

另外,存储缓冲区究竟做了什么？

performance x86 assembly intel cpu-architecture

Cur*_*ous

2019 02-27

8
推荐指数

1
解决办法

717
查看次数

标签统计

assembly ×3

performance ×3

x86 ×3

c++ ×2

atomic ×1

c ×1

concurrency ×1

cpu-architecture ×1

cpu-cache ×1

false-sharing ×1

hyperthreading ×1

intel ×1

micro-optimization ×1

multithreading ×1

optimization ×1

rust ×1

x86-64 ×1

num ++是'int num'的原子吗？

生产者 - 消费者在超兄弟姐妹与非兄弟姐妹之间共享内存位置的延迟和吞吐量成本是多少？

x86-64 的缓存填充大小应该为 128 字节吗？

现代x86实现可以从多个先前的商店中存储转发吗？

英特尔硬件上的商店缓冲区大小？什么是商店缓冲区？

标签 统计

标签统计