C CUDA 内核的 PtrStepSz(GpuMat) 数组

Question

C CUDA 内核的 PtrStepSz(GpuMat) 数组

我正在尝试使用 CUDA 内核内的 GpuMats 数组的信息修改 GpuMat。
为了修改它，我发送 GpuMat 并将其转换为内核中的 PtrStepSz，如下所示：

__global__ void func(cuda::PtrStepSz<float> X)
{//...
}
int main()
{//...
    GpuMat X;
    func<<<blocks, threads>>>(X);
}

Run Code Online (Sandbox Code Playgroud)

工作正常...现在我正在尝试使用 PtrStepSz 数组的信息...我一直在尝试类似的方法：

__global__ void func2(cuda::PtrStepSz<float> arr[])
{//...
}
int main()
{
    cuda::PtrStepSz<float> *d_arr;
    cudaMalloc((void**)&d_arr, sizeof(cuda::PtrStepSz<float>)*N );
    cuda::GpuMat mats[N];
    Mat O = Mat::ones(size, size, CV_32FC1);
    for (int i = 0; i < N; i++){
      mats[i].upload(O);
      d_arr[i] = mats[i];
    }
    func2<<<blocks, threads>>>(d_arr);
    //...
}

Run Code Online (Sandbox Code Playgroud)

这不起作用...甚至初始化部分也不行（我想这是因为我无法从CPU修改GPU内容）...关于如何完成我需要的任何想法？谢谢你的帮助

Answer 1

Jos*_* P. 5

如果它对其他人有帮助...
我已经设法通过创建一个 PtrStepSz 的 CPU 数组，用 GpuMats 初始化它，然后创建一个指向 PtrStepSz 的指针来解决这个问题，我将数组的内容分配到该指针并将其复制到 GPU 上。
结果是这样的：

__global__ void func2(cuda::PtrStepSz<float> arr[])
{//...
}
int main()
{
    cuda::PtrStepSz<float> *sender;
    cuda::PtrStepSz<float> d_arr[N];
    cuda::GpuMat mats[N];
    Mat O = Mat::ones(size, size, CV_32FC1);
    for (int i = 0; i < N; i++){
      mats[i].upload(O);
      d_arr[i] = mats[i];
    }
    cudaMalloc((void**)&sender, sizeof(cuda::PtrStepSz<float>)*N );
    cudaMemcpy(sender, d_arr, sizeof(cuda::PtrStepSz<float>) * N,
      cudaMemcpyHostToDevice);
    func2<<<blocks, threads>>>(sender);
    //...
}

Run Code Online (Sandbox Code Playgroud)

无论如何，我很高兴看看是否有人有更好的主意:)

归档时间：	10 年，5 月前
查看次数：	2391 次
最近记录：	10 年，5 月前