很高兴 gcc 编译器 4.8 带有带有 -Ofast 选项的 AVX 优化。但是,我发现了一个有趣但愚蠢的错误,它增加了不必要的额外计算。也许我错了,所以有人可以给我一个解释吗?
原来的C++源代码如下:
#define N 1000007
float a[N],b[N],c[N],d[N],e[N];
int main(int argc, char *argv[]){
cout << a << ' ' << b << ' ' << c << endl;
for(int x=0; x<N; ++x){
c[x] = 1/sqrt((a[x]+b[x]-c[x])*d[x]/e[x]);
}
return 0;
}
Run Code Online (Sandbox Code Playgroud)
代码在 Ubuntu 14.04.3 x86_64 中使用 g++ 4.8.4 编译: g++ -mavx avx.cpp -masm=intel -c -g -Wa,-ahl=avx.asm -Ofast
汇编源代码如下:
90 .LVL10:
91 006b C5FC2825 vmovaps ymm4, YMMWORD PTR .LC0[rip]
91 00000000
92 0073 31C0 xor eax, …
Run Code Online (Sandbox Code Playgroud)