use*_*005 6 performance x86 x86-64 simd avx2
我对以下内在函数/指令的性能感兴趣:
_mm256_andnot_si256 / vpandn_mm256_and_si256 / vpand_mm256_cmpgt_epi32 / vpcmpgtd但是不幸的是,《英特尔Intrinsics指南》没有包含具有这些内在/指令的延迟和吞吐量数字的表。在哪里可以找到此信息?
延迟和吞吐量数字的三个来源是:
InstlatX64列出了许多不同形式的指令(内存和/或寄存器操作数,不同的操作数宽度等),但是没有有关每个执行端口的触发器数量的信息。对于性能优化,不仅要关注延迟和吞吐量数量,而且每个执行端口的这些触发都非常重要。该信息由Agner Fog的说明表和uops.info提供。
| 归档时间: |
|
| 查看次数: |
221 次 |
| 最近记录: |