如何使用SSE逻辑指令

SMi*_*Mir 0 x86 sse simd

我需要一些关于如何在 Visual Studio 上使用 SSE 逻辑指令的帮助。基于MSDN 网站

__m128 _mm_and_ps(__m128 a , __m128 b );
ANDPS
Run Code Online (Sandbox Code Playgroud)

可用于对操作数ab执行逻辑与操作。但我无法弄清楚获取结果所需的确切步骤(内存加载和初始化、设置、存储等)。

具体来说,我想知道如何:

  1. 执行操作,
  2. 返回结果,然后
  3. 获得结果的大小(有效位数)。

有人可以在一个例子中告诉我如何做到这一点吗?

谢谢!

Pau*_*l R 5

这是一个示例 - 使用 XOR 反转浮点向量中所有元素的符号:

__m128 v1 = _mm_set_ps(0.0f, 1.0f, -1.0f, -2.0f);
                                       //   v1 =  0.0f,  1.0f, -1.0f, -2.0f
__m128 sign = _mm_set1_ps(-0.0f);      // sign = -0.0f, -0.0f, -0.0f, -0.0f
__m128 v2 = _mm_xor_ps(v1, sign);      //   v2 = -0.0f, -1.0f,  1.0f,  2.0f
Run Code Online (Sandbox Code Playgroud)

因此,假设您想否定数组中的所有值,您可以一次处理 4 个元素,如下所示:

const int N = 1024;
float a[N];
const __m128 sign = _mm_set1_ps(-0.0f);// sign = -0.0f, -0.0f, -0.0f, -0.0f
for (int i = 0; i < N; i += 4)
{
    v = _mm_loadu_ps(&a[i]);           // load 4 elements (unaligned) from a[]
    v = _mm_xor_ps(v1, sign);          // invert sign bit (i.e. negate)
    _mm_storeu_ps(&a[i], v);           // store 4 elements (unaligned) back to a[]
}
Run Code Online (Sandbox Code Playgroud)