OpenCV - 将 GpuMat 复制到 cuda 设备数据中

Question

OpenCV - 将 GpuMat 复制到 cuda 设备数据中

我正在尝试将 a 中的数据复制cv::cuda::GpuMat到uint8_t*要在内核中使用的变量。

GpuMat 包含分辨率为 752x480 且类型为 CV_8UC1 的图像数据。下面是示例代码：

uint8_t *imgPtr;
cv::Mat left, downloadedLeft;
cv::cuda::GpuMat gpuLeft;

left = imread("leftview.jpg", cv::IMREAD_GRAYSCALE);
gpuLeft.upload(left);

cudaMalloc((void **)&imgPtr, sizeof(uint8_t)*gpuLeft.rows*gpuLeft.cols);
cudaMemcpyAsync(imgPtr, gpuLeft.ptr<uint8_t>(), sizeof(uint8_t)*gpuLeft.rows*gpuLeft.cols, cudaMemcpyDeviceToDevice);

// following code is just for testing and visualization...
cv::cuda::GpuMat gpuImg(left.rows, left.cols, left.type(), imgPtr);
gpuImg.download(downloadedLeft);
imshow ("test", downloadedLeft);
waitKey(0);

Run Code Online (Sandbox Code Playgroud)

但输出并不如预期。以下分别是输入和输出图像。

输入

输出

我已经尝试将cv::Mat源提供给cudaMemcpy. 看起来运行良好。问题似乎与cv::cuda::GpuMat和有关cudaMemcpy。这里讨论了类似的问题

另外，如果图像是 256 或 512，则程序似乎运行良好。

我缺少什么？应该怎样做才能使 752x480 图像正常工作？

Answer 1

tal*_*ies 5

OpenCV GpuMat使用跨步存储（因此图像不会连续存储在内存中）。简而言之，您的示例在大多数情况下都会失败，因为

您不将整个图像复制到 CUDA 内存分配，并且
当您从 GPU 指针创建第二个 GpuMat 实例时，您没有正确指定内存布局。

通过我阅读文档，您可能想要这样的东西：

uint8_t *imgPtr;
cv::Mat left, downloadedLeft;
cv::cuda::GpuMat gpuLeft;

left = imread("leftview.jpg", cv::IMREAD_GRAYSCALE);
gpuLeft.upload(left);

cudaMalloc((void **)&imgPtr, gpuLeft.rows*gpuLeft.step);
cudaMemcpyAsync(imgPtr, gpuLeft.ptr<uint8_t>(), gpuLeft.rows*gpuLeft.step, cudaMemcpyDeviceToDevice);

// following code is just for testing and visualization...
cv::cuda::GpuMat gpuImg(left.rows, left.cols, left.type(), imgPtr, gpuLeft.step);
gpuImg.download(downloadedLeft);
imshow ("test", downloadedLeft);
waitKey(0);

Run Code Online (Sandbox Code Playgroud)

【从未使用过OpenCV的人编写，未经编译或测试，使用风险自担】

只有当 GpuMat 的行间距偶然与列数乘以矩阵中存储的类型大小相同时，代码才能正常工作。这可能是尺寸为 2 的整数次幂的图像。

归档时间：	7 年，7 月前
查看次数：	8701 次
最近记录：	2 年，4 月前