使用SSE对数,还是切换到FPU?

9 sse logarithm simd natural-logarithm

我正在做一些统计计算.我需要它们快速,所以我重写了大部分内容以使用SSE.我对它很陌生,所以我想知道这里的正确方法是什么:

据我所知,SSE中没有log2或ln功能,至少不能达到4.1,这是我使用的硬件支持的最新版本.

是否更好:

  1. 提取4个浮点数,并对它们进行FPU计算以确定它是否具有熵 - 我不需要将任何这些值加载回SSE寄存器,只需将它们加到另一个浮点数中
  2. 找到执行log2的SSE函数

Pau*_*l R 9

似乎有一些SSE log2实现,例如这一个.

还有英特尔近似数学库,它具有log2其他功能 - 它很旧(2000年),但它是SSE2,它应该仍然可以很好地工作.


也可以看看: