小编dib*_*bid的帖子

我们什么时候需要CUDA中的两个维度线程?

我想知道何时应该在CUDA中使用x和y坐标?我看到一些代码,当它们有嵌套循环时,它们使用x和y坐标.对此有什么一般规则吗?谢谢

cuda gpu gpgpu nested-loops

2
推荐指数
1
解决办法
832
查看次数

gpugems3 中的前缀扫描 CUDA 示例代码是否正确?

我在 GPU Gems 3, Chapter 39: Parallel Prefix Sum (Scan) with CUDA一书中写了一段代码来调用内核。

然而,我得到的结果是一堆负数而不是前缀扫描。

我的内核调用是错误的还是 GPU Gems 3 书中的代码有问题?

这是我的代码:

#include <stdio.h>
#include <sys/time.h>
#include <cuda.h>

__global__ void kernel(int *g_odata, int  *g_idata, int n, int dim)
{
    extern __shared__ int temp[];// allocated on invocation
    int thid = threadIdx.x;
    int offset = 1;

    temp[2*thid] = g_idata[2*thid]; // load input into shared memory
    temp[2*thid+1] = g_idata[2*thid+1];
    for (int d = n>>1; d > 0; d >>= 1) // build sum in place …
Run Code Online (Sandbox Code Playgroud)

cuda gpu nvidia prefix-sum

0
推荐指数
1
解决办法
1753
查看次数

标签 统计

cuda ×2

gpu ×2

gpgpu ×1

nested-loops ×1

nvidia ×1

prefix-sum ×1