正如标题一样,有人可以让我更了解 CUDA 中的堆和堆栈吗?它与CPU内存中的原始堆和堆栈有什么不同吗?
我在 CUDA 中增加堆栈大小时遇到问题,它似乎有其局限性,因为当我将堆栈大小设置为 1024*300 (Tesla M2090) by 时cudaDeviceSetLimit
,出现错误:argument invalid
.
我想问的另一个问题是:当我将堆大小设置为非常大的数字(大约 2GB)以分配具有 2000 个元素的 RTree(数据结构)时,在运行时出现错误: too many resources requested to launch
任何的想法?
P/s:我只用单线程启动 ( kernel<<<1,1>>>
)