这是获得数字绝对值的最快方法

Question

这是获得数字绝对值的最快方法

Dio*_*nes 40 theory algorithm performance absolute-value

哪个是实现返回数字绝对值的操作的最快方法？

x=root(x²)

Run Code Online (Sandbox Code Playgroud)

要么

if !isPositive(x):
    x=x*(-1)

Run Code Online (Sandbox Code Playgroud)

实际上这个问题可以翻译为,有多快if(为什么请).

我的大学程序教授总是告诉我要避免使用ifs,因为它们非常慢,但我总是忘记问多慢和为什么.这里有人知道吗？

Answer 1

vic*_*tcu 78

在不使用if语句的情况下计算2s-补码整数的绝对值有一个很好的技巧.理论上说,如果值为负,则需要切换位并添加一个,否则您希望按原样传递位.XOR 1碰巧切换A和A XOR 0碰巧保持A完好无损.所以你想做这样的事情:

  uint32_t temp = value >> 31;     // make a mask of the sign bit
  value ^= temp;                   // toggle the bits if value is negative
  value += temp & 1;               // add one if value was negative

Run Code Online (Sandbox Code Playgroud)

原则上,您可以在少至三个汇编指令(没有分支)的情况下执行此操作.而且你想认为你用math.h得到的abs()函数可以最佳地完成它.

没有分支==更好的表现.与@ paxdiablo上面的响应相反,这在深层管道中非常重要,在您的代码中,您拥有的分支越多,您的分支预测器就越有可能出错并且必须回滚等等.如果您避免分支在哪里可能的,事情将继续在你的核心全油门:).

我建议使用更简单的“value -= temp”，而不是“value += temp & 1”，并且没有理由对 temp 使用无符号类型。 (3认同)
pff为什么这么大的努力？有没有理由说`((值>> 31)| 1)*value`是不够的？乘法并不昂贵. (3认同)
顺便说一句,这假定值是一个int32_t(即签名),如果不是,你必须在转移它之前将其转换为 (2认同)
如果将 1 读为 1111...1，则 XOR 1 会反转 A。假设右移 (>> 31) 用最左边的副本填充左侧。这称为算术移位。很好的答案，这个小问题让我困惑。 (2认同)

Answer 2

kqu*_*inn 62

条件比普通的算术运算慢,但是比计算平方根时更快,更快.

我的集会日的经验法则:

整数或按位运算:1个周期
浮点加/子/ mul:4个周期
浮点div:~30个周期
浮点取幂:约200个循环
浮点sqrt:约60个周期,具体取决于实现
条件分支:平均 10个周期,如果预测得好则更好,如果误预测会更糟

Answer 3

Ed *_* S. 26

呃,你的老师实际上告诉过你了吗？大多数人遵循的规则是首先使代码可读,然后在证明实际出现问题之后调整任何性能问题. 99.999%的时间你永远不会看到性能问题,因为你使用了太多的if语句. Knuth说得最好,"过早优化是万恶之源".

我理解你的观点,但这与我的问题无关 (28认同)
++我是一名教授,所以我可以证明教授可以说什么,因为谁会打电话给他们的虚张声势？在这方面,他们就像神职人员.教授通过这个学期的投入比传递好的信息更多. (2认同)

Answer 4

Dan*_*ner 11

计算平方根可能是你可以做的最糟糕的事情之一,因为它真的很慢.通常有一个库函数来执行此操作; 像Math.Abs()这样的东西.乘以-1也是不必要的; 只需返回-x.因此,以下是一个很好的解决方案.

(x >= 0) ? x : -x

Run Code Online (Sandbox Code Playgroud)

编译器可能会将其优化为单个指令.由于执行流程较长,现代处理器上的条件可能相当昂贵 - 如果分支被错误预测并且处理器开始从错误的代码路径执行指令,则必须丢弃计算.但是由于提到的编译器优化,在这种情况下你不需要关心.

为什么这个答案没有更多的赞成票？！这编译为`mov eax, edi; 否定 cmovl eax, edi; ret`，它不需要任何注释来解释所有的小玩意。 (5认同)

Answer 5

atl*_*ste 6

哪个是获得数字绝对值的最快方法

我认为“正确”的答案实际上并不在这里。获得绝对数的最快方法可能是使用 Intel Intrinsic。请参阅https://software.intel.com/sites/landingpage/IntrinsicsGuide/并查找“vpas”（或其他为您的 CPU 完成工作的内在函数）。我很确定它会在这里击败所有其他解决方案。

如果您不喜欢内在函数（或不能使用它们或...），您可能需要检查编译器是否足够智能来确定对“本机绝对值”（std::abs在 C++ 或Math.Abs(x)C# 中）的调用是否会改变自动进入内在 - 基本上涉及查看反汇编（编译）代码。如果您在 JIT 中，请确保未禁用 JIT 优化。

如果这也没有给你优化的说明，你可以使用这里描述的方法：https : //graphics.stanford.edu/~seander/bithacks.html#IntegerAbs。

Answer 6

awd*_*nld 5

为了完整起见,这里有一种方法可以在C++的x86系统上实现IEEE浮点数:

*(reinterpret_cast<uint32_t*>(&foo)) &= 0xffffffff >> 1;

Run Code Online (Sandbox Code Playgroud)

@Stefnotch获取32位浮点变量`foo`的地址,转换为32位无符号整数指针,取消引用并应用保存除(MSB)符号位之外的所有位的位掩码 (2认同)

归档时间：	16 年，9 月前
查看次数：	29502 次
最近记录：	6 年，3 月前