gpu*_*guy 3 cuda gpu gpgpu nvidia
据我了解,当主机和设备之间的复制操作开始使用 cudaMemcpy 时,主机指针会自动固定。那么使用单独的 API cudAHostAlloc() 来分配固定主机内存的意义和必要性是什么?
Rob*_*lla 5
这两个操作不一样,并且您传递给的主机指针cudaMemcpy不是“自动固定”的。
cudaMemcpy
对于从可分页内存到设备的传输,主机内存被复制到暂存缓冲区。然后,暂存缓冲区是任何传输的目标。
这使得可分页内存传输(通常)比来自固定内存缓冲区的传输慢。使用固定内存还允许其他可能性,例如拥有可由设备直接访问的映射内存,而无需显式(API 级)传输。
归档时间:
12 年,1 月 前
查看次数:
3506 次
最近记录: