GPU编程——传输瓶颈

Dan*_*dor 5 benchmarking cuda gpu

由于我希望 GPU 为我做一些计算,因此我对测量“纹理”上传和下载速度的主题感兴趣 - 因为我的“纹理”是 GPU 应该处理的数据。

我知道从主内存传输到 GPU 内存是首选方式,因此我预计只有在需要处理大量数据且读回的结果很少的情况下,此类应用程序才会高效。

不管怎样,有这样的基准应用程序吗?我的意思是,为了测量主内存<>GPU传输吞吐量......

编辑(问题澄清):

一旦有一个应用程序,您启动了它,它给出了 2 个数字:

  1. mb/s 主内存和显卡内存之间的传输速率,从主内存到图形、纹理上传

  2. mb/s 主内存和显卡内存之间的传输速率,从图形到主,纹理下载

我只想再次把手放在上面。

另一个编辑(发现了一些东西):

这里http://www.benchmarkhq.ru/english.html?/be_mm.html(搜索TexBench)是一个以一种方式测量吞吐量的应用程序......

Tom*_*Tom 2

要测量主机到设备的内存带宽,您可以使用bandwidthTestCUDA SDK 中的示例(从CUDA 站点下载)。