cse*_*gen 9 profiling cuda opencl nvprof
我正在尝试a.out
在具有NVIDIA TITAN X和CUDA 8.0的系统中分析OpenCL应用程序.
如果是CUDA应用程序,nvprof ./a.out
就足够了.但我发现这不适用于OpenCL应用程序,并显示消息"没有内核被分析".
直到CUDA 7.5,我成功地使用COMPUTE_PROFILE=1
下面这个.不幸的是,文档说"在CUDA 8.0版本中已经删除了使用环境变量COMPUTE_PROFILE对命令行分析器的支持."
问题是,除了降级CUDA以使用nvprof配置OpenCL应用程序之外,还有其他方法吗?
据我所知,nvprof
从未支持 OpenCL 分析。
运行代码会COMPUTE_PROFILE=1
调用基于驱动程序的分析机制,该机制早于nvprof
. 这种基于驱动程序的机制不久前已被弃用,现在已从 CUDA 8 起被删除,转而使用nvprof
.
因此,似乎无法使用 CUDA 工具包分析在 NVIDIA 硬件上运行的 OpenCL 代码。
归档时间: |
|
查看次数: |
1162 次 |
最近记录: |