use*_*108 5 c c++ floating-point performance
我知道在浮点数和整数之间进行转换时可能出现的错误,但性能如何(请忽略准确性问题)?
一般来说,如果我对不同算术类型的操作数进行n-ary操作,即不同的浮点类型(例如float和double)和浮点/整数类型组合(例如float和int),性能是否会受到影响?是否存在经验法则,例如,保持所有操作数相同?
PS:我在问,因为我正在编写一个表达式模板库,想知道是否允许对包含不同算术类型值的向量进行二进制运算.
我怀疑这个问题的答案会因目标架构而异,因为转换可以(但可能不会)在硬件中发生.例如,考虑以下代码,它会导致int和float之间的一些相互转换:
int main (int argc, char** argv)
{
int precoarced = 35;
// precoarced gets forced to float
float result = 0.5 + precoarced;
// and now we force it back to int
return (int)result;
// I wonder what the disassembly looks like in different environments?
}
Run Code Online (Sandbox Code Playgroud)
当我尝试使用默认设置使用g ++(我使用的是Ubuntu,x86)编译它时,并使用gdb进行反汇编:
0x00000000004004b4 <+0>: push %rbp
0x00000000004004b5 <+1>: mov %rsp,%rbp
0x00000000004004b8 <+4>: mov %edi,-0x14(%rbp)
0x00000000004004bb <+7>: mov %rsi,-0x20(%rbp)
0x00000000004004bf <+11>: movl $0x23,-0x8(%rbp)
0x00000000004004c6 <+18>: cvtsi2sdl -0x8(%rbp),%xmm0
0x00000000004004cb <+23>: movsd 0x10d(%rip),%xmm1 # 0x4005e0
0x00000000004004d3 <+31>: addsd %xmm1,%xmm0
0x00000000004004d7 <+35>: unpcklpd %xmm0,%xmm0
0x00000000004004db <+39>: cvtpd2ps %xmm0,%xmm0
0x00000000004004df <+43>: movss %xmm0,-0x4(%rbp)
0x00000000004004e4 <+48>: movss -0x4(%rbp),%xmm0
0x00000000004004e9 <+53>: cvttss2si %xmm0,%eax
0x00000000004004ed <+57>: pop %rbp
0x00000000004004ee <+58>: retq
Run Code Online (Sandbox Code Playgroud)
请注意带有cvt-prefixed助记符的说明.这些是转换说明.因此,在这种情况下,转换是在硬件中的一些指令中进行的.因此,根据这些指令的成本周期,可能会相当快.但同样,不同的架构(或不同的编译器)可能会改变故事.
编辑:有趣的是,由于我不小心指定0.5而不是0.5f,因此在那里有额外的转换.这就是为什么cvtpd2ps op在那里.
编辑:x86已经有很长时间的FP支持(从80年代开始),因此针对x86的C++编译器通常会使用硬件(除非编译器严重落后于时代).感谢Hot Licks指出这一点.