使用Nvidia平台为OpenCL配置本地(共享)内存

cgu*_*her 3 cuda nvidia opencl gpu-shared-memory

我想在我的OpenCL内核中优化我的本地内存访问模式.我在某处读到了可配置的本地内存.例如,我们应该能够配置哪个量用于本地mem以及哪个量用于自动缓存.

另外我读到银行大小可以在这里选择最新的(开普勒)Nvidia硬件:http: //www.acceleware.com/blog/maximizing-shared-memory-bandwidth-nvidia-kepler-gpus.这一点对于本地存储器中的双精度值存储似乎非常关键.

Nvidia是否提供专门为CUDA用户设置本地内存的功能?我找不到OpenCL的类似方法.这可能是以不同的方式调用,还是真的不存在?

jpr*_*ice 5

遗憾的是,使用OpenCL时无法控制L1缓存/本地内存配置.此功能仅由CUDA运行时(通过cudaDeviceSetCacheConfigcudaFuncSetCacheConfig)提供.