小编xua*_*g84的帖子

gcc 4.8 AVX 优化错误:额外的代码插入?

很高兴 gcc 编译器 4.8 带有带有 -Ofast 选项的 AVX 优化。但是,我发现了一个有趣但愚蠢的错误,它增加了不必要的额外计算。也许我错了,所以有人可以给我一个解释吗?

原来的C++源代码如下:

#define N 1000007

float a[N],b[N],c[N],d[N],e[N];

int main(int argc, char *argv[]){
    cout << a << ' ' << b << ' ' << c << endl;
    for(int x=0; x<N; ++x){
        c[x] = 1/sqrt((a[x]+b[x]-c[x])*d[x]/e[x]);
    }
    return  0;
}
Run Code Online (Sandbox Code Playgroud)

代码在 Ubuntu 14.04.3 x86_64 中使用 g++ 4.8.4 编译: g++ -mavx avx.cpp -masm=intel -c -g -Wa,-ahl=avx.asm -Ofast

汇编源代码如下:

  90                    .LVL10:
  91 006b C5FC2825              vmovaps ymm4, YMMWORD PTR .LC0[rip]
  91      00000000 
  92 0073 31C0                  xor     eax, …
Run Code Online (Sandbox Code Playgroud)

optimization gcc sse g++ avx

2
推荐指数
1
解决办法
210
查看次数

标签 统计

avx ×1

g++ ×1

gcc ×1

optimization ×1

sse ×1