相关疑难解决方法(0)

为什么GCC不优化aaaaaa到(aaa)(aaa)？

我正在对科学应用进行一些数值优化.我注意到的一件事是GCC会pow(a,2)通过编译来优化调用a*a,但调用pow(a,6)没有优化,实际上会调用库函数pow,这会大大降低性能.(相比之下,英特尔C++编译器,可执行文件icc,将消除库调用pow(a,6).)

我很好奇的是,当我更换pow(a,6)与a*a*a*a*a*a使用GCC 4.5.1和选项" -O3 -lm -funroll-loops -msse4",它采用5分mulsd的说明:

movapd  %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm14, %xmm13

Run Code Online (Sandbox Code Playgroud)

如果我写(a*a*a)*(a*a*a),它会产生

movapd  %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm14, %xmm13
mulsd   %xmm13, %xmm13

Run Code Online (Sandbox Code Playgroud)

这将乘法指令的数量减少到3. icc具有类似的行为.

为什么编译器不能识别这种优化技巧？

floating-point assembly gcc compiler-optimization fast-math

xis*_*xis

2017 02-03

2083
推荐指数

12
解决办法

20万
查看次数

为什么在C中写入1000,000,000作为100010001000？

在Apple创建的代码中,有这一行:

CMTimeMakeWithSeconds( newDurationSeconds, 1000*1000*1000 )

Run Code Online (Sandbox Code Playgroud)

没有任何理由来表达1,000,000,000的1000*1000*1000？

为什么不1000^3呢？

c integer objective-c literals

Spa*_*Dog

2016 11-17

136
推荐指数

6
解决办法

1万
查看次数

为什么除法比乘法更昂贵？

我并不是真的想要优化任何东西,但我记得我一直都是从程序员那里听到的,我把它当作一个真理.毕竟他们应该知道这些东西.

但我想知道为什么除法实际上比乘法慢？分裂只是一个美化的减法,乘法是一个美化的加法吗？所以在数学上我不明白为什么一种方式或另一种方式在计算上有非常不同的成本.

任何人都可以澄清这个的原因/原因所以我知道,而不是我从其他程序员那里听到的,我之前询问的是:"因为".

performance cpu-architecture multiplication division

Joa*_*nge

2018 11-28

36
推荐指数

2
解决办法

1万
查看次数

从RGB获得Hue的最快公式

如果给出的红色,绿色和蓝色值范围为0-255,那么获得色调值的最快计算是什么？该公式将以30fps(每秒920万次)用于640x480图像的每个像素,因此每一点速度优化都有帮助.

我见过其他公式,但我不满意他们涉及多少步骤.我正在寻找一个实际的公式,而不是内置的库函数.

rgb colors

use*_*533

2017 12-08

23
推荐指数

3
解决办法

3万
查看次数

浮点数的x/a是否与x*(1/a)相同？

随着float a = ...;并且float inva = 1/a;是x / a一样的x * inva？

这种情况是怎样的:

unsigned i = ...;
float v1 = static_cast<float>(i) / 4294967295.0f;
float scl = 1.0f / 4294967295.0f;
float v2 = static_cast<float>(i) * scl;

Run Code Online (Sandbox Code Playgroud)

是v1等于v2对所有无符号整数？

c c++ floating-point

Dan*_*vil

lucky-day

9
推荐指数

2
解决办法

378
查看次数

标签统计

c ×2

floating-point ×2

assembly ×1

c++ ×1

colors ×1

compiler-optimization ×1

cpu-architecture ×1

division ×1

fast-math ×1

gcc ×1

integer ×1

literals ×1

multiplication ×1

objective-c ×1

performance ×1

rgb ×1

为什么GCC不优化a*a*a*a*a*a到(a*a*a)*(a*a*a)？

为什么在C中写入1000,000,000作为1000*1000*1000？

为什么除法比乘法更昂贵？

从RGB获得Hue的最快公式

浮点数的x/a是否与x*(1/a)相同？

标签 统计

为什么GCC不优化aaaaaa到(aaa)(aaa)？

为什么在C中写入1000,000,000作为100010001000？

标签统计