x86有一个很好的双精度小矩阵SIMD库吗?

Jus*_*cle 10 c++ sse simd matrix-multiplication

我正在寻找一个SIMD库,专注于小型(4x4)矩阵操作的图形.那里有很多单精度的,但我需要支持单精度和双精度.

我看过英特尔的IPP MX库,但我更喜欢有源代码的东西.我对这些特定操作的SSE3 +实现非常感兴趣:

  1. Mat4*Mat4
  2. Mat4*Vec4
  3. Mat4*Mat4数组
  4. Mat4*Vec4阵列
  5. Mat4倒置(很高兴)

编辑:请不要"过早优化"答案.任何使用小矩阵的人都知道GCC不会对这些以及手动优化的内在函数或ASM进行矢量化.在这种情况下,这很重要,或者我不会问.

Kar*_*oor 9

也许是特库?

它支持SSE 2/3/4,ARM NEON和AltiVec指令集.