我正在使用计算能力为 6.0 的 Tesla P100。我想找到一个工具来自动获取我的内核代码的最佳网格和块大小。
我最近发现了CUDA 占用计算器(.xls 电子表格)。但我意识到它有点过时了(功能直到 2.1 为止)。
我尝试搜索更新的电子表格,包括更高的 CC,但没有任何结果。
所以我寻找替代方案,发现从 CUDA 6.5 开始,引入了Occupancy API 。这是电子表格的更新替代品吗?
此外,我从 GitHub 上找到了这个工具 。我可以考虑将此作为替代方案吗?还是使用 Occupancy API 更好?
另外,CUDA 分析器(nvprof或Nsight)可以对占用率进行估计并给出一些最佳的块/网格大小吗?
我对这些工具还很陌生。
归档时间: |
|
查看次数: |
964 次 |
最近记录: |