Joh*_*ing 16 optimization profiling cuda
我对CUDA视觉分析器和占用电子表格有点熟悉,尽管我可能没有尽可能地利用它们.分析和优化CUDA代码与分析和优化在CPU上运行的代码不同.所以我希望从您的经验中学习如何充分利用我的代码.
最近有一篇文章寻找最快的代码来识别自己的数字,我提供了一个CUDA实现.我不满意这段代码尽可能快,但是我不知道要找出正确的问题是什么以及我能从哪些工具中得到答案.
您如何确定使CUDA内核执行速度更快的方法?
Tom*_*Tom 21
如果您在Linux上进行开发,那么CUDA Visual Profiler会为您提供大量信息,知道如何处理它可能有点棘手.在Windows上,您还可以使用CUDA Visual Profiler,或者(在Vista/7/2008上),您可以使用与Visual Studio很好地集成的Nexus,并为您提供组合的主机和GPU配置文件信息.
获得数据后,您需要知道如何解释它.GTC 的高级CUDA C演示文稿提供了一些有用的提示.需要注意的主要事项是:
这只是一个开始,查看GTC演示文稿和NVIDIA网站上的其他网络研讨会.