小编Noo*_*oob的帖子

c++ AVX512 内在等效于 _mm256_broadcast_ss()?

我正在将代码从 AVX2 重写为 AVX512。

我可以用来将单个浮点数广播到 _mm512 向量的等效项是什么?在 AVX2 中它是 _mm256_broadcast_ss() 但我找不到像 _mm512_broadcast_ss() 这样的东西。

c++ intel intrinsics avx2 avx512

4
推荐指数
1
解决办法
387
查看次数

使用最少的指令将 4 个单精度浮点数加载并复制到打包的 __m256 变量中

我有一个包含 A、B、C、D 4 个浮点数字的浮点数组,我希望将它们加载到__m256像 AAABBCCDD 这样的变量中。最好的方法是什么?我知道使用_mm256_set_ps()始终是一种选择,但使用 8 个 CPU 指令似乎很慢。谢谢。

c++ avx

2
推荐指数
1
解决办法
489
查看次数

标签 统计

c++ ×2

avx ×1

avx2 ×1

avx512 ×1

intel ×1

intrinsics ×1