相关疑难解决方法(0)

计算AVX2向量中每个元素的前导零位,模拟_mm256_lzcnt_epi32

使用AVX512,有一个internal函数_mm256_lzcnt_epi32,该函数返回一个向量,该向量对于8个32位元素中的每个元素,包含输入向量元素中前导零位的数量。

是否有仅使用AVX和AVX2指令来实现此目标的有效方法?

目前,我正在使用一个循环,该循环提取每个元素并应用该_lzcnt_u32函数。


相关:要对一个大位图进行位扫描,请参见__m256i字中的前导零计数,该字使用pmovmskb->位扫描以找到要执行标量位扫描的字节。

这个问题是关于当您实际上要使用全部8个结果而不仅仅是选择一个时,对8个单独的32位元素执行8个单独的lzcnts。

bit-manipulation simd avx avx2 avx512

6
推荐指数
1
解决办法
164
查看次数

标签 统计

avx ×1

avx2 ×1

avx512 ×1

bit-manipulation ×1

simd ×1