SSE 内在函数 - _mm_and_ps 奇怪的行为

Question

SSE 内在函数 - _mm_and_ps 奇怪的行为

下面的一段代码：

__m128 a   = _mm_setr_ps( 1, 2, 3, 4 );
__m128 b   = _mm_set1_ps( 2 );
__m128 res = _mm_and_ps( a, b );
cout << a[0] << " " << a[1] << " " << a[2] << " " << a[3] << endl;
cout << b[0] << " " << b[1] << " " << b[2] << " " << b[3] << endl;
cout << res[0] << " " << res[1] << " " << res[2] << " " << res[3] << endl;
cout<<endl;
cout << ( 1 & 2 ) << " " << ( 2 & 2 ) << " " << ( 3 & 2 ) << " " << ( 4 & 2 ) << endl;

Run Code Online (Sandbox Code Playgroud)

结果是：

Run Code Online (Sandbox Code Playgroud)

SSE 操作的结果不应该是0 2 2 0因为2 = 010, 4 = 100 => 2&4 = 0.
根据文档：

__m128 _mm_and_ps(__m128 a, __m128 b)

计算 a 和 b 的四个 SP FP 值的按位与。

R0 R1 R2 R3

a0 & b0 a1 & b1 a2 & b2 a3 & b3

Answer 1

Mar*_*ica 5

我找到的文档说：

计算a 和 b的四个单精度浮点值的按位与。

（我的重点）

2 和 4 将具有相同的尾数（0，加上隐含的前导 1 位），指数分别为 128 和 129。按位和那些是零尾数和 128 (== 2.0) 的指数。

编辑

如果要对非负整数进行按位 AND 运算，可以添加偏移量。如果您使用 8388608 (== 1<<23) 的偏移量，那么您可以按预期对 0..8388607 进行按位运算。

const float offset=8388608;
__m128 mm_offset = _mm_set1_ps();
__m128 a   = _mm_setr_ps( 1, 2, 3, 4 );
a =_mm_add_ps(mm_offset,a);
__m128 b   = _mm_set1_ps( 2+offset );
__m128 res = _mm_and_ps( a, b );
res = _mm_sub_ps(res,mm_offset);

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，4 月前
查看次数：	416 次
最近记录：	8 年，4 月前