有人可以清楚解释新的和删除关键字在CUDA 4.2中调用__device__或__global__代码时的行为吗?
__device__
__global__
内存如何分配,如果它在设备上是本地的还是全局的?
我试图在GPU上创建神经网络的问题的上下文条款,我想要一个链接表示(像链表,但每个神经元存储一个链接的连接列表,其中包含权重,指向其他神经元),我知道我可以cudaMalloc在内核启动之前分配使用,但我希望内核控制网络的创建方式和时间.
cudaMalloc
谢谢!
cuda dynamic-memory-allocation
cuda ×1
dynamic-memory-allocation ×1