use*_*999 5 python opencl pyopencl
我正在尝试优化 pyOpenCL 程序。出于这个原因,我想知道是否有办法分析程序并查看大部分时间需要在哪里。
你知道如何解决这个问题吗?
提前 致谢安迪
编辑:例如,用于 CUDA 的 nvidias nvprof 可以用于 pyCuda,但不适用于 pyOpenCL。
小智 1
好的, 我找到了一种方法:Cuda Toolkit 3.1提供了 openCL 的分析(更高版本不会)。从此包中compute visual profiler使用(computeprof.exe). 它可用于 Windows 和 Linux,并且可以与新的 Cuda 工具包一起安装。 它看起来像这样:
Cuda Toolkit 3.1
compute visual profiler
(computeprof.exe)
我希望这对其他人也有帮助。
归档时间:
10 年,10 月 前
查看次数:
2014 次
最近记录:
8 年,9 月 前