与 PCI Express 插槽传输速率相关的 GPU 带宽说明 (v1.x - x16)

har*_*amc 2 gpu data-transfer bandwidth video-card memory-bandwidth

只需要澄清与 PCI Express 传输速率相关的 GPU 带宽。它将帮助我了解显卡的实际工作原理...

所以要计算带宽:

Memory Speed x Bus Width / 8 = Bandwidth (B/s)
Run Code Online (Sandbox Code Playgroud)

因此,如果我的显卡在 GDDR3 上的总线宽度为 256 位且内存速度为 900MHz:

Bandwidth = 900MHz * 256 / 8 = 28GB/s (28GB/s * 2 = 57GB/s because GDDR3 is double data rate)
Run Code Online (Sandbox Code Playgroud)

PCI Express v1.0 上的单通道传输速率为 250MB/s,因此 16 通道将是 4GB/s。

令我困惑的是,接口(PCIe)的传输速率为 4GB/s,而显卡的传输速率为 57GB/s。

问:那么这会不会因为接口只能传输4GB/s而造成瓶颈?

Nay*_*uki 6

您已经正确识别出显卡的内存速度明显高于它与外部设备(尤其是系统 RAM)通信的速度。

从主存加载数据(用于 GPGPU)或纹理(用于 3D 渲染)到 GPU 内存相对较慢,这在业界是众所周知的。一旦数据存储在 GPU 的内存中,更高的内部带宽使 GPU 的计算单元能够有效工作并提供远高于 CPU 的性能。