在其中一个解决方案中,他/她发现AVX 向量的abs(inp)为,
__m256 符号位 = _mm256_set1_ps(-0.0f); __m256 inp_abs = _mm256_andnot_ps(sign_bit, inp);
其背后的逻辑是什么?
SSE/AVX:根据每个元素的最小和最大绝对值从两个 __m256 浮点向量中进行选择
floating-point ieee-754 avx absolute-value avx2
absolute-value ×1
avx ×1
avx2 ×1
floating-point ×1
ieee-754 ×1