小编Ada*_*rsh的帖子

在 CUDA 中使用寄存器内存

我有一些关于 cuda 寄存器内存的问题

1)有没有办法在cuda内核中释放寄存器?我在寄存器中有变量,一维和二维数组。(最大数组大小 48)

2)如果我使用设备函数,那么我在设备函数中使用的寄存器在执行后会发生什么?它们是否可用于调用内核执行或其他设备功能?

3) nvcc 如何优化寄存器使用?请分享内存密集型内核的重要wrt优化要点

PS:我有一个复杂的算法可以移植到 cuda,它需要大量的寄存器进行计算,我试图弄清楚是将中间数据存储在寄存器中并写入一个内核还是将其存储在全局内存中并在多个内核中中断算法.

cuda

4
推荐指数
1
解决办法
4158
查看次数

标签 统计

cuda ×1