Pet*_*Lee 5 x86 sse bit-manipulation simd
假设我有这行代码,它使用 SSE2 加载 16 x 8 位无符号整数
// ptr is a pointer to uint8_t array
__m128i b = _mm_load_si128((const __m128i*) ptr);
Run Code Online (Sandbox Code Playgroud)
我想将每个 8 位无符号整数b
(总共 16 个)分成4 位高和 4 位低部分。我怎样才能做到这一点?
您需要遮盖下部并将上部移动到正确的位置。由于没有字节移位SSE指令,因此移位后还需要屏蔽上半部分。
__m128i b = _mm_load_si128((const __m128i*) ptr);
__m128i mask = _mm_set1_epi8(0xf);
__m128i lower = _mm_and_si128(b, mask);
__m128i upper = _mm_and_si128(_mm_srli_epi16(b, 4), mask);
Run Code Online (Sandbox Code Playgroud)