是否有任何关于 AVX2 收集指令延迟的数据?

use*_*893 5 performance x86 latency micro-optimization avx2

是否有关于 AVX2 收集延迟的任何数据?

(例如 _mm256_i32gather_ps 指令访问单个缓存行)

小智 3

此页面提供所有内在函数的延迟数据:

英特尔内联指南

_mm256_i32gather_ps 的延迟为 6。