英特尔 FFT 性能

Dan*_*dor 4 performance benchmarking sse fft

哪种处理器性能更好,i5-2500K还是对于每秒的某些 FFT 操作(例如:在 16k 缓冲区长度上就地进行复杂的 FFT),i7-960 ?

我这样问是因为我想让所有核心和所有线程饱和,并且由于 i7 有 8 个线程而 i5 只有 4 个线程,所以我主要关心的是 SSE 指令是否能够在所有 8 个逻辑线程上并行运行。

osg*_*sgx 5

此测试http://ixbtlabs.com/articles3/cpu/ci7-turbo-ht-p1.html?pages=ci7-turbo-ht-p1.html

显示在 i7 上打开 HT 对于 FFT 的增益为 0%。(科学应用表,行FFT)。FFT 来自 MATLAB(基于名为 FFTW 的库)。

i7-960 有 4 个核心和 8 个线程,来自超线程 (HT)。正如 ixbt 所示,HT 无助于计算更多的 FFT,因此我建议您购买具有相同 4 核但频率更高、涡轮增压(动态超频)和更新技术的较新 i5-2500。

此外,这个“i5”采用下一代微架构(SNB - Sandy Bridge),并且具有 AVX(每 GHz FLOPS 两倍)。如果 FFT 可以使用它(使用现代库和现代编译器),它的FFT 性能几乎会翻倍(如果我们不考虑内存带宽限制)。英特尔表示,其新 MKL 中的 AVX 增长了 1.8 倍:http://software.intel.com/en-us/articles/intel-avx-optimization-in-intel-mkl-v103/

对于 N=1024 的 radix-2 1D CFFT,AVX/NHM(在 Nehalem NHM 上启用 AVX)加速为 1.8 倍

因此,i5-2500 的每刻度比 AVX 提高了 1.8 倍,它具有更高的 GHz(无论是规格还是 TurboBoost),并且支持更快的内存(NHM 为 DDR3-1066,i5 SND 为 DDR3-1333)。

  • 0% 的增益是因为仍然只有 4 个物理 FPU,并且有 8 个线程在争夺它们。对于数学繁重的计算,通常会在 2 个线程上进行 I/O 上下文切换,但从来不会这样做,因此它的行为就像最大负载下的四核一样。 (2认同)