我想提取具有 8 位元素的 256 位 AVX 寄存器中最高设置位的索引。我既找不到bsr也找不到clz实现。
bsr
clz
对于clz32 位元素,有一个带有浮点转换的 bithack,但这对于 8 位来说可能是不可能的。
目前,我正在研究一个解决方案,在那里我逐个检查位,稍后我会添加,但我想知道是否有更快的方法来做到这一点。
c++ simd intrinsics avx avx2
avx ×1
avx2 ×1
c++ ×1
intrinsics ×1
simd ×1