gcc,simd内在函数和快速数学概念

roc*_*441 11 gcc simd intrinsics fast-math

大家好:)
我试图抓住一些关于浮点,SIMD /数学内在函数和gcc的快速数学标志的概念.更具体地说,我在x86 cpu上使用MinGW和gcc v4.5.0.

我现在已经搜索了一会儿,这就是我(我想)我现在所理解的:

当我没有标志编译时,任何fp代码将是标准x87,没有simd内在函数,math.h函数将从msvcrt.dll链接.

当我使用mfpmath,mssen和/或march使得mmx/sse/avx代码被启用时,gcc实际上只有在我还指定一些优化标志时才使用simd指令,如Onftree-vectorize.在这种情况下,内部函数是由gcc自动选择的,并且一些数学函数(我仍在谈论math.h上的标准数学函数)将成为内在函数或通过内联代码进行优化,其他函数仍将来自msvcrt. DLL.如果我没有指定优化标志,这会改变吗?

当我使用特定的simd数据类型(那些可用作gcc扩展,如v4siv8qi)时,我可以选择直接调用内部函数,或者再次将自动决定留给gcc.如果我没有通过正确的标志启用simd指令,Gcc仍然可以选择标准的x87代码.同样,如果我没有指定优化标志,这会改变吗?

如果我的任何陈述错误,请纠正我:p

现在的问题是:

  1. 我是否必须包含x86intrin.h才能使用内在函数?
  2. 我是否必须链接libm?
  3. 什么快速数学与任何东西有关?我理解它放宽了IEEE标准,但具体来说,如何?使用其他标准功能?其他一些lib链接?或者只是在某处设置了几个标志,标准的lib表现不同?

感谢任何想要帮助的人:D

roc*_*441 6

好吧,对于那些正在努力掌握像我这样的概念的人来说,我感到很紧张.

使用Ox的优化适用于任何类型的代码,fpu或sse

fast-math似乎只适用于x87代码.此外,它似乎没有改变fpu控制字o_O

内置总是包括在内.对于某些内置函数,可以避免此行为,并使用一些标记,例如strict或no-builtins.

libm.a用于glibc中没有包含的一些东西,但是mingw它只是一个虚拟文件,所以目前链接到它是没用的

使用gcc的特殊向量类型似乎只在直接调用内在函数时才有用,否则代码无论如何都会被矢量化.

欢迎任何更正:)

有用的链接:
fpu/sse控制
gcc数学
和关于"Vector Extensions","X86内置函数"和"其他内置函数"的gcc手册