我正在尝试使用NVCC选项获取有关CUDA内核中寄存器使用情况的一些信息,虽然使用全局函数一切正常,但我在设备函数方面遇到了一些困难,因为
--ptxas-options=v
ptxas info : Used N registers
输出中缺少行。我尝试使用 noinline 关键字并将它们保存在另一个文件中,相对于调用全局函数,因为我认为NVCC正在报告全局函数的完整寄存器使用情况,包括内联后调用的设备寄存器,但没有任何变化。我可以获得有关设备功能的寄存器使用情况的信息,只需将它们定义为全局即可。
你有什么建议吗?
谢谢!