简明的SSE和MMX指令参考,具有延迟和吞吐量

Joe*_*Joe 12 assembly sse reference manual mmx

我试图通过使用内联汇编的MMX和SSE指令集来优化某些算法.但是,我无法找到这些增强指令集的时序和用法的良好参考.你能否帮我找一些参考文献,其中包含有关吞吐量,延迟,操作数以及说明的简短描述的信息?

到目前为止,我发现:

英特尔指令参考 英特尔64和IA-32架构开发人员手册:Vol.2AIntel 64和IA-32架构开发人员手册:Vol.2B

英特尔优化指南 http://www.intel.com/Assets/PDF/manual/248966.pdf

整数运算计时 http://gmplib.org/~tege/x86-timing.pdf

小智 10

英特尔指令参考应该为这些指令实际执行的内容提供足够的指导,我会想到吗?它具有每个伪代码,其操作的描述,在某些情况下甚至是代表性案例的一个小图.

对于时间安排,没有我所知道的官方指南.Agner Fog的页面是标准参考:

http://www.agner.org/optimize/


hrr*_*hrr 7

英特尔的内在指南(左AVX页面的底部),是一个组织严密的搜索工具,在那里你可以通过SSE版本和/或指令类型,例如,FP算术和逻辑整数缩小.

对于每条指令,它还按CPU和参数显示延迟/吞吐量表.

  • 这是我发现的最好的,可以看到哪些指令可以做你想要的.其他指南非常适合详细说明每个ASM指令的功能,但这需要很多空间,以至于无法获得概述.我希望有类似于内在指南的东西,但对于asm直接.不过,它主要是1:1的映射. (2认同)