Den*_*aia 80 cpu x86 assembly x86-64 machine-code
rep; nop
意思?pause
指令一样吗?rep nop
(没有分号)相同?nop
指令有什么区别?在另一个问题的评论中进行了一些讨论后,我意识到我不知道rep; nop;
x86(或x86-64)汇编中的含义.而且我也无法在网上找到一个好的解释.
我知道这rep
是一个前缀,意味着"重复下一个指令cx
时间"(或至少它是,在旧的16位x86汇编中).根据这一维基百科汇总表,似乎rep
只能与使用movs
,stos
,cmps
,lods
,scas
(但也许是对新的处理器去掉这个限制).因此,我认为rep nop
(没有分号)将重复nop
操作cx
时间.
然而,经过进一步搜索,我更加困惑.它似乎rep; nop
并pause
映射到完全相同的操作码,并且pause
有一些不同的行为nop
.2005年的一些旧邮件说不同的东西:
有了这些不同的意见,我无法理解正确的含义.
它正在Linux内核中使用(在i386和x86_64上)以及此注释:/* REP NOP (PAUSE) is a good thing to insert into busy-wait loops. */
它也在BeRTOS中使用,具有相同的注释.
ugh*_*fhw 68
rep; nop
确实与pause
指令(操作码F390
)相同.它可能用于不支持该pause
指令的汇编程序.在以前的处理器上,这根本没有做任何事情,就像nop
两个字节一样.在支持超线程的新处理器上,它用作处理器的提示,您正在执行spinloop以提高性能.从英特尔的指令参考:
改善了自旋等待循环的性能.当执行"自旋等待循环"时,Pentium 4或Intel Xeon处理器在退出循环时会遭受严重的性能损失,因为它检测到可能的内存顺序违规.PAUSE指令向处理器提供代码序列为自旋等待循环的提示.在大多数情况下,处理器使用此提示来避免内存顺序违规,从而大大提高了处理器性能.因此,建议在所有自旋等待循环中放置PAUSE指令.
Pet*_*des 12
不适用于指令的前缀将被忽略.但是,未来的CPU可以使用该字节序列来编码新指令.(是的,x86操作码空间是如此有限,以至于他们做了像这样的疯狂的东西,是的,它使解码器变得复杂.)
在这种情况下,这意味着您可以rep nop
在spinloops中使用而不会破坏向后比较.不知道的旧CPU pause
会将其解码为NOP而不会造成任何伤害.在新CPU上,您可以获得节能/ HT友好性的好处,并且当您正在旋转的内存确实发生变化并且您正在离开旋转循环时,可以避免内存排序错误推测.
链接到英特尔的手册以及x86标签维基信息页面上的大量其他好东西:https://stackoverflow.com/tags/x86/info
另一种无意义的pause
前缀成为新CPU的新指令: lock
是rep
.在不支持该指令的CPU上(在其CPUID中缺少LZCNT功能标志),它解码为f3 xx
,运行方式与之相同pause
.因此,在旧CPU上,它会产生pause
,并且在输入为零时未定义.
一个无意义的pause
前缀可能永远不会以不同的方式解码:rep
默认情况下由gcc用于定位"通用"CPU(即不针对特定的CPU,lzcnt
或者F3 0F BD /r
不针对AMD K8或K10.)任何人都需要几十年的时间.可以使CPU解码rep bsr
为其他任何东西bsr
,因为它存在于大多数Linux发行版的大多数二进制文件中.看看 `rep ret'是什么意思?
归档时间: |
|
查看次数: |
23652 次 |
最近记录: |