NVIDIA Fermi 中的 L2 缓存

Zk1*_*001 5 cuda gpu gpgpu nvidia

在查看NVIDIA Fermi架构中性能计数器的名称(cuda doc文件夹中的文件Compute_profiler.txt)时,我注意到对于L2缓存未命中,有两个性能计数器,l2_subp0_read_sector_misses和l2_subp1_read_sector_misses。他们说这些是用于两片 L2 的。

为什么他们有两片 L2?与流式多处理器架构有什么关系吗?这种划分对性能有什么影响?

谢谢

fab*_*ioM 1

我认为与流式多处理器没有任何直接关系。

我只是认为该切片相当于银行内存。

只需将两者的值相加即可得到“总”L2 读取未命中数。