我可以将特定数据预取到CUDA内核中的特定缓存级别吗?

dal*_*cai 8 caching cuda gpgpu prefetch ptx

据我所知,Fermi GPU支持预取L1或L2缓存.但是,在CUDA参考手册中我找不到任何关于它的东西.

Dues CUDA允许我的内核代码预取特定数据到特定级别的缓存?

ker*_*rem 6

那么不是在指令级别,而是在这里有关GPU中预取的详细信息:

GPGPU应用程序的多线程感知预取机制
(2010年微架构ACM研讨会上的论文)

您可以在nVIDIA的PTX ISA参考文档中找到指令参考; 相关说明是prefetchprefetchu.