相关疑难解决方法(0)

用于SSE和AVX的SIMD数学库

我正在为SSE和AVX寻找SIMD数学库(最好是开源).我的意思是,例如,如果我有一个具有8个浮点值的AVX寄存器v,我希望sin(v)一次返回所有八个值的sin.

AMD有一个propreitery库,LibM http://developer.amd.com/tools/cpu-development/libm/,它有一些SIMD数学函数,但如果它检测到Intel CPU没有的FMA4,LibM只使用AVX.另外我不确定它是否完全使用AVX,因为所有的功能名称都以s4(d2)而不是s8(d4)结尾.它提供了比英特尔CPU上的标准数学库更好的性能,但它并没有好多少.

英特尔将SVML作为其C++编译器的一部分,但编译器套件在Windows上非常昂贵.此外,英特尔还削弱了非英特尔CPU上的库.

我找到了以下AVX库,http://software-lisc.fbk.eu/avx_mathfun/,它支持一些数学函数(exp,log,sin,cos和sincos).它为我提供了非常快的结果,比SVML更快,但我没有检查准确性.它仅适用于单个浮点,并且在Visual Studio中不起作用(尽管这很容易修复).它基于另一个SSE库.

有没有人有任何其他建议？

编辑:我发现一个SO线程有很多关于这个主题的答案 Vectorized Trig函数在C？

sse simd math.h avx

作者

14
推荐指数

1
解决办法

1万
查看次数

用于SSE类型的战俘

我使用SSE类型进行了一些明确的矢量化计算,例如__m128(在xmmintrin.hetc中定义),但是现在我需要将向量的所有元素提升到某个(相同的)幂,即理想情况下我会想要类似的东西__m128 _mm_pow_ps(__m128, float),遗憾的是它不存在.

围绕这个最好的方法是什么？我可以存储向量,调用std::pow每个元素,然后重新加载它.这是我能做的最好的吗？编译器如何std::pow在自动矢量化代码时实现调用,否则代码可以很好地实现矢量化？有没有提供有用功能的库？

(请注意,这个问题与重复有关,当然也没有一个有用的答案.)

7
推荐指数

1
解决办法

4285
查看次数

SIMD 寄存器的数学函数

根据https://sourceware.org/glibc/wiki/libmvec GCC 具有数学函数的矢量实现。它们可以被编译器用于优化，可以在这个例子中看到： https: //godbolt.org/g/IcxtVi，编译器使用一些损坏的正弦函数并一次对 4 个双精度数进行操作

我知道如果我需要数学函数，可以使用 SIMD 数学库，但我仍然感兴趣是否有一种方法可以使用__m256d某种内在函数或任何其他方式手动调用 GCC 中已经存在的向量化数学函数？

6
推荐指数

1
解决办法

3810
查看次数

Clang的'_mm256_pow_ps'本质在哪里？

我似乎找不到_mm_pow_ps或_mm256_pow_ps的内在函数，它们都应该包含在'immintrin.h'中。

Clang不会定义这些，还是在我不包括的标头中？

3
推荐指数

1
解决办法

830
查看次数

标签统计

avx ×3

sse ×3

simd ×2

c ×1

c++ ×1

gcc ×1

pow ×1