Dan*_*ann 1 compiler-construction performance benchmarking assembly
IA-32,IA-64上哪个算术指令集操作最慢,速度最快?有排名吗?基准?
一般来说,这些是平方根和除法指令,特别是对于标量浮点流水线.
对于IA-32和IA-64,您可能需要查看英特尔(R)IA-64和IA-32架构优化参考手册,其中包含附录C中不同处理器上每条指令的周期计数.您将看到SIMD等效指令以较低的精度执行得更好,并且它们一次在4个元件上运行.如果你需要更高的平方根和倒数平方根精度,你必须用额外的Newton-Raphson步骤手动完成.