roc*_*441 11 gcc simd intrinsics fast-math
大家好:)
我试图抓住一些关于浮点,SIMD /数学内在函数和gcc的快速数学标志的概念.更具体地说,我在x86 cpu上使用MinGW和gcc v4.5.0.
我现在已经搜索了一会儿,这就是我(我想)我现在所理解的:
当我没有标志编译时,任何fp代码将是标准x87,没有simd内在函数,math.h函数将从msvcrt.dll链接.
当我使用mfpmath,mssen和/或march使得mmx/sse/avx代码被启用时,gcc实际上只有在我还指定一些优化标志时才使用simd指令,如On或ftree-vectorize.在这种情况下,内部函数是由gcc自动选择的,并且一些数学函数(我仍在谈论math.h上的标准数学函数)将成为内在函数或通过内联代码进行优化,其他函数仍将来自msvcrt. DLL.如果我没有指定优化标志,这会改变吗?
当我使用特定的simd数据类型(那些可用作gcc扩展,如v4si或v8qi)时,我可以选择直接调用内部函数,或者再次将自动决定留给gcc.如果我没有通过正确的标志启用simd指令,Gcc仍然可以选择标准的x87代码.同样,如果我没有指定优化标志,这会改变吗?
如果我的任何陈述错误,请纠正我:p
现在的问题是:
感谢任何想要帮助的人:D
好吧,对于那些正在努力掌握像我这样的概念的人来说,我感到很紧张.
使用Ox的优化适用于任何类型的代码,fpu或sse
fast-math似乎只适用于x87代码.此外,它似乎没有改变fpu控制字o_O
内置总是包括在内.对于某些内置函数,可以避免此行为,并使用一些标记,例如strict或no-builtins.
libm.a用于glibc中没有包含的一些东西,但是mingw它只是一个虚拟文件,所以目前链接到它是没用的
使用gcc的特殊向量类型似乎只在直接调用内在函数时才有用,否则代码无论如何都会被矢量化.
欢迎任何更正:)
有用的链接:
fpu/sse控制
gcc数学
和关于"Vector Extensions","X86内置函数"和"其他内置函数"的gcc手册