如何使用CUDA 8.0 nvprof配置OpenCL应用程序

cse*_*gen 9 profiling cuda opencl nvprof

我正在尝试a.out在具有NVIDIA TITAN X和CUDA 8.0的系统中分析OpenCL应用程序.

如果是CUDA应用程序,nvprof ./a.out就足够了.但我发现这不适用于OpenCL应用程序,并显示消息"没有内核被分析".

直到CUDA 7.5,我成功地使用COMPUTE_PROFILE=1下面这个.不幸的是,文档说"在CUDA 8.0版本中已经删除了使用环境变量COMPUTE_PROFILE对命令行分析器的支持."

问题是,除了降级CUDA以使用nvprof配置OpenCL应用程序之外,还有其他方法吗?

tal*_*ies 4

据我所知,nvprof从未支持 OpenCL 分析。

运行代码会COMPUTE_PROFILE=1调用基于驱动程序的分析机制,该机制早于nvprof. 这种基于驱动程序的机制不久前已被弃用,现在已从 CUDA 8 起被删除,转而使用nvprof.

因此,似乎无法使用 CUDA 工具包分析在 NVIDIA 硬件上运行的 OpenCL 代码。