编写一个计算简单函数积分的程序。在测试它时,我发现如果我使用的数组大小大于 1000 万个元素,则会产生错误的答案。我发现该错误似乎是在 CUDA 内核中操作数组后发生的。1000 万个及以下的元素工作正常并产生正确的结果。
可传输到 GPU 或在 GPU 上计算的元素数量是否有大小限制?
PS 使用包含浮点数的 C 样式数组。
我使用推力来查找数组的总和,c,但我不断收到编译器错误"错误:表达式必须具有类类型"
float tot = thrust::reduce(c.begin(), c.end());
Run Code Online (Sandbox Code Playgroud)
这是不起作用的代码行,c是一个float数组,是另外两个数组的元素和.
干杯