小编Chr*_*r23的帖子

__device__ 函数中的 NVCC 寄存器使用报告

我正在尝试使用NVCC选项获取有关CUDA内核中寄存器使用情况的一些信息,虽然使用全局函数一切正常,但我在设备函数方面遇到了一些困难,因为
--ptxas-options=v

ptxas info : Used N registers

输出中缺少行。我尝试使用 noinline 关键字并将它们保存在另一个文件中,相对于调用全局函数,因为我认为NVCC正在报告全局函数的完整寄存器使用情况,包括内联后调用的设备寄存器,但没有任何变化。我可以获得有关设备功能的寄存器使用情况的信息,只需将它们定义为全局即可。

你有什么建议吗?

谢谢!

cuda gpu nvcc ptxas

3
推荐指数
1
解决办法
2446
查看次数

标签 统计

cuda ×1

gpu ×1

nvcc ×1

ptxas ×1