Cyg*_*sX1 11
在设备1.0中,您只有两个选项:
然而,在设备1.2和1.3中,这是以不同方式完成的.想象一下,您的设备内存分为每个128字节的块.您需要的内存事务数与您命中的块数一样多.所以:
有这么多的情况,所以把它分成两个类别:合并/未合并已经没有任何意义了.这就是为什么,Cuda Profiler采用了不同的方式.它们只计算内存事务的数量.您的访问模式越随机,内存事务计数就越高,即使您拥有相同的内存访问指令数.
以上是略微简化的模型.实际上,内存事务可以访问128字节,64字节或32字节宽的块 - 以节省带宽.查找列加载128b,加载64b,加载32b,并在您的探查器中存储128b,存储64b,存储32b.
| 归档时间: |
|
| 查看次数: |
1989 次 |
| 最近记录: |