我所知.CUDA上的常量内存是特定内存.它比全局内存更快.但是在OpenCL的规范中.我得到以下的话.
该
__constant或常量地址空间名称是用来描述全局内存分配的变量,这是一个内核(S)作为只读变量访问内部
所以__constant内存来自__global内存.这是否意味着它与__global内存具有相同的访问性能?
这取决于您使用的OpenCL平台的硬件和软件架构.例如,可以设想具有只读高速缓存的架构,其不需要参与高速缓存一致性.这些缓存可用于常量内存,但不能用于全局内存.因此,您可能会看到对常量内存的更快访问.
话虽这么说,我熟悉的架构都不是这样运作的.所以这只是假设.
| 归档时间: |
|
| 查看次数: |
924 次 |
| 最近记录: |