在 OPENCL 和 CUDA 中,分别有原语,即barrier() 和syncthread(),用于强制L1 数据缓存/共享内存的一致性。这是否意味着缓存本身是不连贯的,即在硬件中没有为 L1 缓存实现类似 CPU 的缓存连贯协议?
gpu gpgpu
gpgpu ×1
gpu ×1