我想从我的 GPU 应用程序中提取数据以检查其限制。我必须使用nvprof因为该应用程序在远程服务器上运行,所以我应该创建一个文件以在Visual Profiler 中本地导入。我尝试使用nvprof -o file_name <app> <params>和来创建文件,nvprof --analysis-metrics --output-profile file_name <app> <params>但是当我在 Visual Profiler 上导入这些文件时,在分析部分中,某些字段为空:“全局内存加载数据不足”、“全局内存存储数据不足”、“内核不足” SM数据”.... 我怎样才能生成一个文件(或更多)以获得分析部分的所有信息?我用带有标志的nvcc编译 cuda 代码-lineinfo -arch compute_20 -code sm_20 --ptxas-options=-v。这些是空字段的一些示例:
| 归档时间: |
|
| 查看次数: |
5027 次 |
| 最近记录: |