在当今的大多数nVIDIA GPU上,共享内存的大小(OpenCL术语中的"本地内存")仅为16 KiB. 我有一个应用程序,我需要创建一个具有10,000个整数的数组.所以我需要适应10,000个整数的内存量= 10,000*4b = 40kb.
gpu nvidia gpu-shared-memory
gpu ×1
gpu-shared-memory ×1
nvidia ×1