我正在尝试优化我的OpenCL内核,而我现在所拥有的只是NVidia Visual Profiler,它似乎相当受限制.我想看看内核的逐行配置文件,以便更好地理解合并等问题.是否有办法获得比Visual Profiler提供的更全面的分析数据?
小智 5
我认为 AMD CodeXL 正是您要找的。它是一组免费的工具,包含一个 OpenCL 调试器和一个 GPU 分析器。OpenCL 调试器允许您对 OpenCL 内核和主机代码进行逐行调试,查看不同工作组中的所有变量,查看发生的特殊事件和错误等。 GPU 分析器有一个很好的功能,可以生成时间线显示您的程序在数据传输和内核执行等任务上花费的时间。
有关更多信息和下载链接,请查看http://developer.amd.com/tools-and-sdks/heterogeneous-computing/codexl/
不,没有这样的工具,但您可以分析代码更改。尝试测量代码的速度,更改一些内容,然后再次测量。clEnqueueNDRangeKernel 有一个 Event 参数,之后可以与 clGetEventProfilingInfo 一起使用,计时器非常敏锐,精度以微秒为单位。这是衡量单独代码部分性能的唯一方法......
归档时间: |
|
查看次数: |
8111 次 |
最近记录: |