有没有办法分析 OpenCL 或 pyOpenCL 程序?

use*_*999 5 python opencl pyopencl

我正在尝试优化 pyOpenCL 程序。出于这个原因,我想知道是否有办法分析程序并查看大部分时间需要在哪里。

你知道如何解决这个问题吗?

提前
致谢安迪

编辑:例如,用于 CUDA 的 nvidias nvprof 可以用于 pyCuda,但不适用于 pyOpenCL。

小智 1

好的,
我找到了一种方法:Cuda Toolkit 3.1提供了 openCL 的分析(更高版本不会)。从此包中compute visual profiler使用(computeprof.exe). 它可用于 Windows 和 Linux,并且可以与新的 Cuda 工具包一起安装。
它看起来像这样:

时间安排 总时间直方图 历史2 历史3

我希望这对其他人也有帮助。