GPU编程——传输瓶颈

Question

由于我希望 GPU 为我做一些计算，因此我对测量“纹理”上传和下载速度的主题感兴趣 - 因为我的“纹理”是 GPU 应该处理的数据。

我知道从主内存传输到 GPU 内存是首选方式，因此我预计只有在需要处理大量数据且读回的结果很少的情况下，此类应用程序才会高效。

不管怎样，有这样的基准应用程序吗？我的意思是，为了测量主内存<>GPU传输吞吐量......

编辑（问题澄清）：

一旦有一个应用程序，您启动了它，它给出了 2 个数字：

我只想再次把手放在上面。

另一个编辑（发现了一些东西）：

这里http://www.benchmarkhq.ru/english.html?/be_mm.html（搜索TexBench）是一个以一种方式测量吞吐量的应用程序......

Answer 1

要测量主机到设备的内存带宽，您可以使用bandwidthTestCUDA SDK 中的示例（从CUDA 站点下载）。