我正在将代码从 AVX2 重写为 AVX512。
我可以用来将单个浮点数广播到 _mm512 向量的等效项是什么?在 AVX2 中它是 _mm256_broadcast_ss() 但我找不到像 _mm512_broadcast_ss() 这样的东西。
我有一个包含 A、B、C、D 4 个浮点数字的浮点数组,我希望将它们加载到__m256像 AAABBCCDD 这样的变量中。最好的方法是什么?我知道使用_mm256_set_ps()始终是一种选择,但使用 8 个 CPU 指令似乎很慢。谢谢。