kri*_*ris 4 intel xeon-phi server
Xeon W 系列、铜牌、银牌、金牌和白金系列之间的实际区别是什么?
对于早期版本的 Xeon,E3 是单插槽 CPU。而 E5 可用于具有两个插槽的主板。E7 支持四插槽(也可能是 8 个)
然而,对于当前这一代 Xeon,大多数产品线都具有 2S 的可扩展性(一块主板上有 2 个处理器)
如果 Xeon Silver 和 Xeon Platinum 可以用于双插槽主板,为什么我需要铂金处理器,它至少比 Silver 贵 5 倍?除非有其他差异。
当前一代 Xeon 处理器之间有何区别?我发现缓存大小存在一些差异。除此之外,我找不到其他任何东西。
金级/白金级每个插槽有更多核心,和/或更高的基础时钟或涡轮时钟。这就是您所支付的大部分费用。
\n\n当在 2 插槽系统中使用时,让它们在 4S 或更高版本系统中工作的额外 UPI 链接并不相关,但这不是唯一的功能。想必这只是成本的一小部分。随着从包容性 L3 缓存变为非包容性,Skylake Xeon 及更高版本已经需要与 L3 标签分开的监听过滤器,即使对于单插槽也是如此,这与 Xeon E5 不同,Xeon E5 只是将所有内容广播到另一个插槽。据推测,Xeon-SP 的探听过滤器也可以用于过滤对其他插槽的探听,因此它不需要成为 1S 与 2S 的单独功能。
\n\n例如,高端第二代 (Cascade Lake) Intel\xc2\xae Xeon\xc2\xae Platinum 9282 处理器有 56 个核心(112 个线程),最大睿频 = 3.8 GHz,基本时钟 = 2.6 GHz,L3 为 77 MB缓存。
\n\n最高端的 Silver 是Intel\xc2\xae Xeon\xc2\xae Silver 4216:16c/32t 3.2 GHz Turbo、2.10 GHz Base、22 MB L3 缓存。
\n\n尽管核心数量几乎是原来的 4 倍,但 Platinum 的持续和峰值 Turbo 时钟频率更高。(TDP 为 400W,而 Silver 为 100W!不太疯狂的 Platinum 芯片的 TDP 较低,例如,具有 2.3GHz 基本频率/3.7GHz Turbo 的 32c/64t 的 TDP 为 250W)。
\n\n此外,一些(全部?)银牌/铜牌 CPU 仅具有一个 AVX512 FMA 执行单元,因此 512 位 SIMD FP 数学指令的吞吐量会降低,包括所有 FP 数学和 int<->FP 转换,以及_mm512_lzcnt_epi32. # of AVX-512 FMA Unit在 Ark 页面上 查找特定 CPU 的行。对于整数 SIMD,仅乘法受到影响。 (在硬件中,SIMD 整数乘法微指令在 FMA 单元上运行。)移位、混合、洗牌、加/减、比较和布尔运算都具有单独的向量 ALU,它们的宽度为 512 位,并且占用的芯片面积较少乘数。
即使是高端 Silver 4216 Cascade Lake 也只有 1 512 位 FMA 单元。
\n\n运行 AVX2 代码,差异为零。即使仅使用 256 位向量的 AVX512 也可以。(gcc -march=skylake-avx512默认为 ,-mprefer-vector-width=256因为使用 512 位向量会暂时降低最大睿频。它希望避免这样一种情况:一个不重要的 512 位向量化循环会影响程序其余部分的时钟速度,而程序的其余部分大部分时间都花在标量代码中.)
但是,如果您正在进行大量 AVX-512 FP 数字运算,您可能需要具有 2 个 FMA 单元的 CPU 并使用 512 位向量进行编译。
\n\n我不知道你为什么给这个 Xeon Phi 贴上标签;这是一个完全不同的微架构。
\n| 归档时间: |
|
| 查看次数: |
8245 次 |
| 最近记录: |