Vla*_*mir 6 parallel-processing cuda opencl
我正在尝试将CUDA代码转换为OpenCL,现在我仍然坚持使用这些函数/变量:
__syncthreads()blockIdx.x其实我是靠自己找到的!这是一篇有用的文章:http://www.netlib.org/utk/people/JackDongarra/PAPERS/parcocudaopencl.pdf
答案是:对于__syncthreads()使用barrier(CLK_LOCAL_MEM_FENCE); 对于blockIdx.x,请使用get_group_id(0)!
| 归档时间: |
|
| 查看次数: |
2382 次 |
| 最近记录: |