我想知道,cuda 4.0是否支持使用本地内存或共享内存的递归?我必须自己维护一个使用全局内存的堆栈,因为系统级递归不能支持我的程序(可能是太多级别的递归).当递归变得更深时,线程停止工作. 所以我真的想知道CUDA中的默认递归是如何工作的,它是否使用共享内存的本地内存?谢谢!
cuda
cuda ×1