此链接 说 cuBLAS-XT 例程提供核外操作 - 操作数数据的大小仅受系统内存大小的限制,不受 GPU 板载内存大小的限制。这意味着只要输入数据可以存储在 CPU 内存上并且输出的大小大于 GPU 内存大小我们就可以使用 cuBLAS-XT 函数,对吗?
另一方面,这个链接说“在非常大的问题的情况下,cublasXt API 提供了将一些计算卸载到主机 CPU 的可能性”和“当前,只有例程 cublasXtgemm() 支持这个功能。这是吗?输入大小大于CPU内存大小的问题的情况?
没看懂这两者的区别!如果有人帮助我理解差异,我将不胜感激。
| 归档时间: |
|
| 查看次数: |
620 次 |
| 最近记录: |