在CUDA 2.0设备上有没有办法只为一个特定变量禁用L1缓存?我知道,一个可以在编译时禁用L1缓存添加标志-Xptxas -dlcm=cg,以nvcc对所有内存操作.但是,我想仅对特定全局变量的内存读取禁用缓存,以便所有其余内存读取都通过L1缓存.
-Xptxas -dlcm=cg
nvcc
基于我在网络上进行的搜索,可能的解决方案是通过PTX汇编代码.
assembly caching cuda cpu-cache ptx
assembly ×1
caching ×1
cpu-cache ×1
cuda ×1
ptx ×1