我需要在每次内核调用后将一个布尔值或整数值从设备复制到主机(我在for循环中调用相同的内核).也就是说,在每次内核调用之后,我需要将一个整数或一个布尔值发送回主机.做这个的最好方式是什么?
我应该将值直接写入RAM吗?或者我应该使用cudaMemcpy()?或者还有其他方法吗?每次内核启动后只复制1个整数会减慢我的程序吗?
cuda
cuda ×1