相关疑难解决方法(0)

为什么GCC不优化aaaaaa到(aaa)(aaa)？

我正在对科学应用进行一些数值优化.我注意到的一件事是GCC会pow(a,2)通过编译来优化调用a*a,但调用pow(a,6)没有优化,实际上会调用库函数pow,这会大大降低性能.(相比之下,英特尔C++编译器,可执行文件icc,将消除库调用pow(a,6).)

我很好奇的是,当我更换pow(a,6)与a*a*a*a*a*a使用GCC 4.5.1和选项" -O3 -lm -funroll-loops -msse4",它采用5分mulsd的说明:

movapd  %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm14, %xmm13

Run Code Online (Sandbox Code Playgroud)

如果我写(a*a*a)*(a*a*a),它会产生

movapd  %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm13, %xmm13

Run Code Online (Sandbox Code Playgroud)

这将乘法指令的数量减少到3. icc具有类似的行为.

为什么编译器不能识别这种优化技巧？

floating-point assembly gcc compiler-optimization fast-math

xis*_*xis

2017 02-03

2083
推荐指数

12
解决办法

20万
查看次数

C++中的浮点加法是否可交换？

对于浮点值,是否保证a + b == b + a？

我相信这在IEEE754中是有保证的,但是C++标准没有规定必须使用IEEE754.唯一相关的文本似乎来自[expr.add]#3:

binary +运算符的结果是操作数的总和.

数学运算"和"是可交换的.然而,数学运算"sum"也是关联的,而浮点加法肯定不是关联的.所以,在我看来,我们不能断定数学中"和"的交换性意味着这个引用指的是C++中的交换性.

c++ floating-point language-lawyer

M.M*_*M.M

lucky-day

36
推荐指数

3
解决办法

5705
查看次数

浮点加法和乘法是否相关？

当我添加三个浮点值并将它们与1进行比较时,我遇到了问题.

cout << ((0.7 + 0.2 + 0.1)==1)<<endl;     //output is 0
cout << ((0.7 + 0.1 + 0.2)==1)<<endl;     //output is 1

Run Code Online (Sandbox Code Playgroud)

为什么这些价值观会有所不同？

c++ floating-point

Kar*_*yan

2014 06-23

10
推荐指数

3
解决办法

5310
查看次数

双和ffast数学的自动矢量化

为什么必须使用-ffast-mathg ++来实现使用doubles 的循环向量化？我不喜欢-ffast-math因为我不想失去精确度.

double gcc g++ vectorization fast-math

Rug*_*rra

2016 11-28

6
推荐指数

1
解决办法

3359
查看次数

标签统计

floating-point ×3

c++ ×2

fast-math ×2

gcc ×2

assembly ×1

compiler-optimization ×1

double ×1

g++ ×1

language-lawyer ×1

vectorization ×1

为什么GCC不优化a*a*a*a*a*a到(a*a*a)*(a*a*a)？

C++中的浮点加法是否可交换？

浮点加法和乘法是否相关？

双和ffast数学的自动矢量化

标签 统计

为什么GCC不优化aaaaaa到(aaa)(aaa)？

标签统计