是否可以在不阻塞主机的情况下同步两个CUDA流?我知道有cudaStreamWaitEvent
,它是非阻塞的。但是使用cudaEventCreate
和创建和破坏事件呢cudaEventDestroy
?
该文档的cudaEventDestroy
说:
如果调用cudaEventDestroy()时已记录事件但尚未完成事件,则该函数将立即返回,并且一旦设备完成事件,与事件关联的资源将自动释放。
我不明白的是,已记录事件和已完成事件之间有什么区别。同样,这似乎意味着如果尚未记录该事件,则呼叫正在阻塞。
任何人都可以对此有所了解吗?