英特尔手动优化(2019 年 9 月修订版)显示了用于 Ice Lake 微架构的 48 KiB 8 路关联 L1 数据缓存。
1软件可见的延迟/带宽会因访问模式和其他因素而异。
这让我感到困惑,因为:
总而言之,缓存的处理成本似乎更高,但延迟仅略有增加(如果确实如此,则取决于英特尔对该数字的确切含义)。
有一点创造力,我仍然可以想象一种快速索引 96 组的方法,但第二点对我来说似乎是一个重要的突破性变化。
我错过了什么?
x86 intel cpu-architecture cpu-cache micro-architecture
cpu-architecture ×1
cpu-cache ×1
intel ×1
micro-architecture ×1
x86 ×1