标签: cusignal

如何使用 GPU 实现更快的 convolve2d

我最近正在学习 PyCuda，并计划替换相机系统的一些代码以加快图像处理速度。该部分最初使用cv2.filter2D。我的目的是用GPU加速处理。

Time for signal.convolve2d: 1.6639747619628906
Time for cusignal.convolve2d: 0.6955723762512207
Time for cv2.filter2D: 0.18787837028503418

Run Code Online (Sandbox Code Playgroud)

然而，cv2.filter2D 似乎仍然是三者中最快的。如果输入是一长串图像，自定义 PyCuda 内核是否会超过 cv2.filter2D？

import time
import cv2
from cusignal.test.utils import array_equal
import cusignal
import cupy as cp
import numpy as np
from scipy import signal
from scipy import misc
ascent = misc.ascent()
ascent = np.array(ascent, dtype='int16')

ascentList = [ascent]*100

filterSize = 3
scharr = np.ones((filterSize, filterSize), dtype="float") * (1.0 / (filterSize*filterSize))

startTime = time.time()
for asc in ascentList:
    grad = signal.convolve2d(asc, scharr, …

Run Code Online (Sandbox Code Playgroud)

python opencv scipy cupy cusignal

YFG*_*YFG

2020 03-06

5
推荐指数

1
解决办法

3157
查看次数