Luc*_*Luc 3 cuda
我有一个程序,我尝试将主机功能与GPU内核重叠.为了检查主机功能与GPU内核的重叠程度,我使用的是NVIDIA的可视化分析器.但是,探查器不会显示我的主机功能的任何计时结果.相反,它只显示CUDA内核的CPU时间.
有没有办法将主机功能的计时结果整合到视觉分析器的时间线中?
Rob*_*lla 6
对的,这是可能的.看一下NVIDIA工具扩展API,它在profiler手册中有记录.
您可能希望标记要检查重叠的主机代码部分的范围.
归档时间:
12 年,5 月 前
查看次数:
565 次
最近记录: