将 CUDA nvprof 输出导出到 Visual Profiler

Ste*_*onà 6 cuda nvvp nvprof

我想从我的 GPU 应用程序中提取数据以检查其限制。我必须使用nvprof因为该应用程序在远程服务器上运行,所以我应该创建一个文件以在Visual Profiler 中本地导入。我尝试使用nvprof -o file_name <app> <params>和来创建文件,nvprof --analysis-metrics --output-profile file_name <app> <params>但是当我在 Visual Profiler 上导入这些文件时,在分析部分中,某些字段为空:“全局内存加载数据不足”、“全局内存存储数据不足”、“内核不足” SM数据”.... 我怎样才能生成一个文件(或更多)以获得分析部分的所有信息?我用带有标志的nvcc编译 cuda 代码-lineinfo -arch compute_20 -code sm_20 --ptxas-options=-v。这些是空字段的一些示例:在此处输入图片说明

小智 1

您可以尝试添加会话,而不是将 prof 文件导入到可视分析器中。我遇到了类似的问题。我所做的是根据这里的说明添加一个会话,您将能够看到所有信息。