har*_*amc 2 gpu data-transfer bandwidth video-card memory-bandwidth
只需要澄清与 PCI Express 传输速率相关的 GPU 带宽。它将帮助我了解显卡的实际工作原理...
所以要计算带宽:
Memory Speed x Bus Width / 8 = Bandwidth (B/s)
Run Code Online (Sandbox Code Playgroud)
因此,如果我的显卡在 GDDR3 上的总线宽度为 256 位且内存速度为 900MHz:
Bandwidth = 900MHz * 256 / 8 = 28GB/s (28GB/s * 2 = 57GB/s because GDDR3 is double data rate)
Run Code Online (Sandbox Code Playgroud)
PCI Express v1.0 上的单通道传输速率为 250MB/s,因此 16 通道将是 4GB/s。
令我困惑的是,接口(PCIe)的传输速率为 4GB/s,而显卡的传输速率为 57GB/s。
问:那么这会不会因为接口只能传输4GB/s而造成瓶颈?
您已经正确识别出显卡的内存速度明显高于它与外部设备(尤其是系统 RAM)通信的速度。
从主存加载数据(用于 GPGPU)或纹理(用于 3D 渲染)到 GPU 内存相对较慢,这在业界是众所周知的。一旦数据存储在 GPU 的内存中,更高的内部带宽使 GPU 的计算单元能够有效工作并提供远高于 CPU 的性能。