Leo*_*313 6 memory-management cuda opencl
我对Nvidia的这个API很新,有些表达对我来说不太清楚.我想知道是否有人可以帮我理解何时以及如何以简单的方式使用这些CUDA命令.更确切地说:
研究如何通过并行执行内核(例如使用CUDA)来加速某些应用程序,在某些时候我遇到了加速主机 - 设备交互的问题.我有一些信息,在网上冲浪,但我有点困惑.很明显,当可以使用cudaHostRegister()和/或时,你可以更快cudaHostAlloc().在这里解释说
"您可以使用该
cudaHostRegister()命令获取一些数据(已经分配)并将其固定,以避免额外的副本进入GPU".
"记住内存"是什么意思?为什么这么快?我以前如何在这个领域做到这一点?之后,在链接的同一视频中,他们继续解释这一点
"如果你正在传输PINNED内存,你可以使用异步内存传输
cudaMemcpyAsync(),这让CPU在内存传输过程中继续工作".
PCIe事务是否完全由CPU管理?是否有公交车经理负责这件事?也非常感谢部分答案在最后重新组合拼图.
在OpenCL中有一些关于等效API的链接也很感激.
| 归档时间: |
|
| 查看次数: |
1947 次 |
| 最近记录: |