Zk1*_*001 5 cuda gpu gpgpu nvidia
在查看NVIDIA Fermi架构中性能计数器的名称(cuda doc文件夹中的文件Compute_profiler.txt)时,我注意到对于L2缓存未命中,有两个性能计数器,l2_subp0_read_sector_misses和l2_subp1_read_sector_misses。他们说这些是用于两片 L2 的。
为什么他们有两片 L2?与流式多处理器架构有什么关系吗?这种划分对性能有什么影响?
谢谢
fab*_*ioM 1
我认为与流式多处理器没有任何直接关系。
我只是认为该切片相当于银行内存。
只需将两者的值相加即可得到“总”L2 读取未命中数。
归档时间:
14 年,5 月 前
查看次数:
836 次
最近记录:
13 年,7 月 前