相关疑难解决方法(0)

使用CUDA运行时API检查错误的规范方法是什么？

查看有关CUDA问题的答案和评论,以及CUDA标记维基,我发现通常建议每个API调用的返回状态都应该检查错误.API文档包括像功能cudaGetLastError,cudaPeekAtLastError以及cudaGetErrorString,但什么是把这些结合在一起,以可靠地捕捉和无需大量额外的代码报告错误的最好方法？

cuda error-checking

tal*_*ies

2019 04-22

252
推荐指数

4
解决办法

9万
查看次数

如果行程计数不是常数,为什么我的#pragma-unrolled循环的性能会降低？

我有以下代码使用循环展开:

#pragma unroll
for (int i=0;i<n;i++)
{
    ....
}

Run Code Online (Sandbox Code Playgroud)

这里如果n是一个定义的常量,一切正常.但是,如果n是变量,则性能会大幅降低.我注意到发出并执行了大约3次指令.我想我正在寻找一种在运行时进行循环展开的方法,可能这是不可行的.

loops cuda unroll

sma*_*ato

2017 04-08

11
推荐指数

1
解决办法

8648
查看次数

标签统计

cuda ×2

error-checking ×1

loops ×1

unroll ×1

使用CUDA运行时API检查错误的规范方法是什么？

如果行程计数不是常数,为什么我的#pragma-unrolled循环的性能会降低？

标签 统计

标签统计