CUDA：HtoD 和 DtoH 带宽之间的差异

Question

CUDA：HtoD 和 DtoH 带宽之间的差异

另一个与带宽相关的问题。我预计设备到主机带宽的图和主机到设备的带宽图相似，但我发现两者之间存在显着差异。考虑到两者都走相同的路线，所以有效带宽应该是相同的，不是吗？该测试台由两个插槽上的总共 12 个 Intel Westmere CPU、4 个带有 4 个 PCIe Gen2 Express 插槽的 Tesla C2050 GPU 组成。使用 NVidia 代码示例中的带宽测试程序。在此输入图像描述

从主机与设备执行 cudamemCpy 的开销是多少？

Answer 1

har*_*ism 5

首先，我想说这两条曲线是相似的。我可以诚实地说，我从未在我使用过的任何系统上见过对称 PCI-e 带宽 - 并且包括 CUDA 和图形 (OpenGL/D3D) 测试，所以我认为这没什么（特别是这个微小的差异））这应该是你关心的。

与您的其他 PCI-e 带宽问题一样，答案是相似的 - 驱动程序可能对不同类型和大小的传输使用不同的策略，试图获得尽可能高的吞吐量。

实际吞吐量取决于许多因素，包括 GPU 的类型，尤其是所使用的主机芯片组。

归档时间：	14 年，7 月前
查看次数：	2585 次
最近记录：	14 年，7 月前