我想使用python提高卷积的性能,并希望能够对如何最好地提高性能有所了解.
我目前正在使用scipy执行卷积,使用的代码有点像下面的代码片段:
import numpy
import scipy
import scipy.signal
import timeit
a=numpy.array ( [ range(1000000) ] )
a.reshape(1000,1000)
filt=numpy.array( [ [ 1, 1, 1 ], [1, -8, 1], [1,1,1] ] )
def convolve():
global a, filt
scipy.signal.convolve2d ( a, filt, mode="same" )
t=timeit.Timer("convolve()", "from __main__ import convolve")
print "%.2f sec/pass" % (10 * t.timeit(number=10)/100)
Run Code Online (Sandbox Code Playgroud)
我正在处理图像数据,使用灰度(0到255之间的整数值),我目前每个卷积得到大约四分之一秒.我的想法是做以下其中一项:
使用corepy,最好进行一些优化使用icc和ikml重新编译numpy.使用python-cuda.
我想知道是否有人对这些方法有任何经验(什么样的增益是典型的,如果值得花时间),或者是否有人知道有更好的库与Numpy进行卷积.
谢谢!
编辑:
通过使用Numpy在C中重写python循环来加速大约10倍.
他们有什么方法可以优化Jython而无需求助于分析或显着更改代码?
具体是有没有可以传递给编译器的标志,或紧密循环中的代码提示.