更有效的方法来将设备向量归零

Ran*_*Guy 0 c++ cuda

将先前使用cudaMalloc分配的设备向量归零的最佳(有效)方法是什么?

启动一个线程在GPU中执行此操作?

kan*_*yin 5

链接到cudaMemset()

cudaError_t cudaMemset ( void* devPtr, int  value, size_t count )
Run Code Online (Sandbox Code Playgroud)

将设备内存初始化或设置为值.使用常量字节值填充devPtr指向的内存区域的第一个计数字节.

请注意,除非devPtr引用固定主机内存,否则此功能与主机异步.

注意:

  • 请注意,此函数还可能返回先前异步启动的错误代码.

  • 另请参见memset同步详细信息.