相关疑难解决方法(0)

SSE/AVX:根据每个元素的最小和最大绝对值从两个__m256浮点向量中选择

我正在寻找高效的AVX(AVX512)实现

// Given
float u[8];
float v[8];

// Compute
float a[8];
float b[8];

//  Such that
for ( int i = 0; i < 8; ++i )
{
    a[i] = fabs(u[i]) >= fabs(v[i]) ? u[i] : v[i];
    b[i] = fabs(u[i]) <  fabs(v[i]) ? u[i] : v[i];
}
Run Code Online (Sandbox Code Playgroud)

也就是说,我需要选择逐个元素为auv基础mask,并为b基于!mask,在mask = (fabs(u) >= fabs(v))逐元素.

sse intrinsics avx avx512

4
推荐指数
1
解决办法
436
查看次数

标签 统计

avx ×1

avx512 ×1

intrinsics ×1

sse ×1