相关疑难解决方法(0)

acc = _mm256_add_pd(acc, _mm256_mul_pd(row, vec));
//acc in this point contains {2.0, 8.0, 18.0, 32.0}
acc = _mm256_hadd_pd(acc, acc);
result[i] = ((double*)&acc)[0] + ((double*)&acc)[2];

Run Code Online (Sandbox Code Playgroud)

此代码有效,但我想用SSE/AVX指令替换它.

c++ optimization sse avx avx2

Pet*_*ter

lucky-day

6
推荐指数

2
解决办法

1690
查看次数

在非常小的阵列中找到最小值

我正在使用长int数据,我试图确定数组中的最小元素.我知道循环遍历数组的传统方法来找到最小值.这个问题是检查是否有其他方法可以加快速度.

这个数组的某些属性可能可以帮助我们加快速度,但我不确定如何.

该数组恰好有8个长整数.每当我们调用该函数时,我们从数组中找到一个min,并且数字被另一个数字替换,我们重复这一步.(至少80亿次)

我想要记住下一次迭代的第二大数字(因为我们将在当前迭代中对它们进行比较).与通过数组的线性实现相比,这是否有用？

也允许排序,但我们必须以某种方式记住使用临时数组的原始位置.这会更有效吗？

还能以某种方式使用SIMD来确定长期最小值吗？即使是毫秒级的加速也很有用,因为我正在进行数十亿次此操作.

c c++ arrays algorithm performance

che*_*ish

2015 07-20

0
推荐指数

1
解决办法

330
查看次数

标签统计

c++ ×3

sse ×3

avx ×2

optimization ×2

x86 ×2

algorithm ×1

arrays ×1

assembly ×1

avx2 ×1

c ×1

floating-point ×1

performance ×1

simd ×1

在x86上做水平浮点矢量和的最快方法

在x86 SIMD向量中查找最大元素的索引

使用SSE/AVX获取存储在__m256d中的值的总和

在非常小的阵列中找到最小值

标签 统计

标签统计