我读到制造商不再专注于更高的时钟速度,现在正在致力于其他事情以提高性能。
和
当使用(单线程)执行简单的加密比较时
openssl aes256c
Run Code Online (Sandbox Code Playgroud)
台式机的性能远远好于服务器。
那么即使是最新的优化,为什么时钟速度更好的处理器性能更好呢?
cpu performance clockspeed computer-architecture cpu-architecture
我认为我买过的所有英特尔芯片都是 IA-32 架构。
Intel Itanium 是在台式机还是笔记本电脑中销售?
我曾想过有人会说“32 位是旧新闻”,因为您在 RAM 中受到限制而不会进行切换,例如使用PAE。首先假设以下因素影响处理器的速度本身:
微架构设计,意味着像缓存大小、微代码的实现(如果适用)、数据/地址总线和寄存器连接,当然还有设计原则或结构。
总线速度,例如 FSB 速度(前端总线)和相关的速度。
特殊功能,如并行性、“超线程”、“计算单元”、使用协处理器或后台处理器卸载工作、多核环境等。
假设(并且我们知道所有这些因素都会影响速度因素)处理器是 32 位的,仅仅因为位宽、内存寻址、大小等的增加,仅 64 位的事实是否会使其更快? ?
基本上,如果有两个相同的处理器,64 位处理器在机器码解码、获取、访问内存、MMIO、计算等方面是否会比之前的 32 位克隆更快?
我刚刚构建了一台新的 Skylake PC,我将看到使用 Prime95 作为压力测试器进行一些超频。
它在正常使用中工作正常,但使用 Prime95 我注意到在某些负载下 CPU 节流。
如果所有 4 个内核(8 个线程)都以 100% 的速度阻塞,为什么 Prime95 中的 Small FFT 设置比“混合”选项的温度更高?
它们都可以同时处理多个指令,但我想有一个根本的区别,这解释了为什么有两个名称,而我们并没有总是切换到使用超标量?
另外,如果我理解正确的话,现代 CPU 中都存在标量和向量指令,所以我认为这两者并不相互排斥(标量指令,如 mov 或 add 将被超标量执行,例如点积将被计算为向量-ly 以某种特殊的黑魔法方式)?
在一个典型的指令周期中,取、译码、执行共同构成一个周期。我的问题是关于解码步骤:解码的部分是什么,它是指令的操作码吗?如果是这样,那么为什么要对其进行编码?
事实上,我理解这里的解码方式与在安全领域给定密钥的情况下解码消息的方式类似,这让我有点困惑。
增加每周期指令或增加周期计数都是处理器制造商的有效设计选择。我理解理论,但如果我有一些现实生活中的例子会更清楚。
那么,谁能给我一些可以使这两种设计选择都受益的例子?比如哪种应用程序/类型的应用程序/流程利用了更高的 IPC 计数,以及哪个利用了更高的循环计数。
cpu ×8
32-bit ×1
64-bit ×1
clockspeed ×1
cpu-usage ×1
memory ×1
performance ×1
prime95 ×1
process ×1
throttling ×1