Cuda 占用计算器的新版本或替代版本是什么?

Mar*_*ara 0 cuda nvidia

我正在使用计算能力为 6.0 的 Tesla P100。我想找到一个工具来自动获取我的内核代码的最佳网格和块大小。

我最近发现了CUDA 占用计算器(.xls 电子表格)。但我意识到它有点过时了(功能直到 2.1 为止)。

  • 我尝试搜索更新的电子表格,包括更高的 CC,但没有任何结果。

  • 所以我寻找替代方案,发现从 CUDA 6.5 开始,引入了Occupancy API 。这是电子表格的更新替代品吗?

  • 此外,我从 GitHub 上找到了这个工具 。我可以考虑将此作为替代方案吗?还是使用 Occupancy API 更好?

另外,CUDA 分析器(nvprofNsight)可以对占用率进行估计并给出一些最佳的块/网格大小吗?

我对这些工具还很陌生。

Rob*_*lla 5

CUDA 占用计算器电子表格的更新版本随 CUDA 工具包一起提供,因此当您安装 CUDA 工具包时,Excel 电子表格也会安装在您的计算机上。也许最简单的方法就是使用操作系统的文件查找实用程序来查找它。

CUDA占用 API允许您在运行时进行相同的计算。

NVIDIA 分析器提供了一些检查已实现占用率的功能。例如,nvvp可以显示已实现的占用率,并且您可以使用 nvprof 收集已实现占用率的指标。您可能希望简单地在探查器文档中搜索“占用”一词。这些工具不会估计最佳块和网格大小,但它们可能会指示占用率是否会成为应用程序的性能限制因素。这些工具还可以报告每个内核启动的实际块和网格大小。