在Fermi上,每个SM有32个存储区,每两个时钟周期提供32位.
在开普勒,每个SMX有32个存储区,每个时钟周期提供64位.然而,由于开普勒SMX从根本上重新设计,以提高能效,而且由于运行速度快的时钟吸引了大量的电能,开普勒从慢得多的核心时钟.有关更多信息,请查看GTC 的Inside Kepler讲话,大约8分钟.
所以问题的答案是开普勒有2倍,而不是4倍.
下一版本的文档(CUDA 5.0)应该更好地解释这一点.
归档时间: |
|
查看次数: |
2940 次 |
最近记录: |