如何向用户解释至强和 i7/消费级 CPU 的区别

use*_*ber 1 performance central-processing-unit

我知道这 2 个 CPU,由于许多不同的因素,在相同的时钟速度下仍然不同,但意识到我真的没有足够的知识来清楚地解释它。我认为缓存和优化在其中发挥了不错的作用,但是有人可以解释我如何告诉我的开发人员他们的 MacBook Pro CPU 没有临时 VM Xeon CPU 快,即使核心数量和时钟速度相同?如果这两个指标相等(或者我认为它可以),是什么使 CPU 能够在单个周期内完成比另一个周期更多的工作?

我知道磁盘子系统、网络等都是影响性能的因素;这仅关注 CPU 性能。

Cho*_*er3 11

首先,至强有 6 个内核和 12 个线程,而 i7 最多只有 4 个内核和 8 个线程(有一些 6 核/12 个线程的 i7,但它们对于笔记本电脑来说太热了)。

唯一以 3.0Ghz 运行的 i7 是 2 核/4 线程 3540M 和 4610M 以及 4 核/8 线程 3940M 和 4930MX - 所有这些都使用 DMI 2.0,其最大内存传输速率超过 20Gbps四个通道,因此理论最大值为 10GBps。

X5670 实际上是 2.93Ghz 芯片,不是 3.0Ghz,而是具有 2 × 6.4 GT/s QPI,结果为 25.6GB/s,由于 L2/3 显着增加,实际上比 i7 更容易实现缓存可用。


Rus*_*ove 5

除了核心数和时钟速度、缓存速度和大小以及内存总线速度之外,至少还有两个因素:

  • 现代英特尔 CPU 动态调整时钟速度以控制热量/功耗。当只有一个进程受计算限制时,它们会加速,运行一个内核非常“热”,而其他内核则基本上处于空闲状态。当多个内核忙时,时钟速度会下降。台式机和服务器机器通常可以处理比笔记本电脑更多的热量,笔记本电脑的尺寸和低噪音比原始电源更受欢迎。

  • Intel CPU 架构的不同迭代对 x86 指令集中的许多指令有不同的实现。对于大量指令,可以有不同的实现选择来权衡电路复杂性、速度和功耗。每个内核中有几个“执行单元”,允许一些指令或部分指令同时执行;指令本身被“流水线化”成几个步骤,不同的 CPU 线以不同的方式分解这些步骤。把单个核心想象成一个餐厅厨房,有一定数量的煎锅、燃烧器、碗、器皿、量杯和厨师——显然可以做出很多权衡来改变任何给定食物的性能命令。