为什么_mm_pause（）可以显着提高性能？

xml*_*lmx 5 performance x86 assembly cpu-architecture lockless

根据Intel的手册（第112页）：

无效_mm_pause（无效）

下一条指令的执行被延迟特定的执行时间。该指令不会修改架构状态。此内在函数提供了特别重要的性能提升。

也就是说：

while (!acquire_spin_lock()) _mm_pause(); // code snippet 1

速度更快，功耗更低

while (!acquire_spin_lock()) continue; // code snippet 2

我可以理解为什么代码片段1的功耗比代码片段2低。

我不明白的是：

为什么代码片段1比代码片段2快？

归档时间：	6 年，6 月前
查看次数：	73 次
最近记录：	6 年，6 月前

什么是"代表; nop;" 在x86汇编中意味着什么？它与"暂停"指令相同吗？ 80

x86中"PAUSE"指令的目的是什么？ 53

x86中"PAUSE"指令的目的是什么？ 53

x86如何在spinlock*中暂停指令,*可以在其他场景中使用吗？ 37

更多相关链接

优化PostgreSQL以进行快速测试 196

session_start()需要非常长的时间 22

实现动态多时间轴队列 17

Quicksort奇怪的时间复杂度,c ++ 12

使用ac#lambda有效的将NameValueCollection转换为查询字符串？ 10

比较$("#foo .bar")和$(".bar","#foo")的性能 9

如何加速Java Google App Engine部署？ 7

你是否需要用汇编语言编写真正的代码？ 7

Intel的RAPL如何估算功耗 7

我的第一个装配程序出错(GCC内联装配) 5

什么是Python中的元类？ 5409

在JavaScript中深度克隆对象的最有效方法是什么？ 5181

如何将空目录添加到Git存储库？ 4039

使用jQuery从下拉列表(选择框)中获取所选文本 2240

Bash中的Echo newline打印文字\n 2171

我为什么要使用指针而不是对象本身？ 1532

如何从其他线程更新GUI？ 1331

如何找出哪个DOM元素具有焦点？ 1234

如何在不使用存储库的情况下将Docker镜像从一个主机复制到另一个主机 1181

功能编程是否取代了GoF设计模式？ 1028