我的CUDA应用程序具有小于8KB的恒定内存.由于它都将被缓存,我是否需要担心每个线程访问相同的地址以进行优化?
如果是,我如何确保所有线程同时访问同一地址?
optimization memory-management cuda
cuda ×1
memory-management ×1
optimization ×1