我能做些什么来加速numpy中的蒙面数组?我有一个非常低效的函数,我重新编写使用蒙版数组(我可以掩盖行,而不是像我一样屏蔽行而不是复制和删除行).但是,我惊讶地发现掩码函数慢了10倍,因为掩码数组的速度要慢得多.
举一个例子,采取以下(掩盖对我来说慢了6倍):
import timeit
import numpy as np
import numpy.ma as ma
def test(row):
return row[0] + row[1]
a = np.arange(1000).reshape(500, 2)
t = timeit.Timer('np.apply_along_axis(test, 1, a)','from __main__ import test, a, np')
print round(t.timeit(100), 6)
b = ma.array(a)
t = timeit.Timer('ma.apply_along_axis(test, 1, b)','from __main__ import test, b, ma')
print round(t.timeit(100), 6)
Run Code Online (Sandbox Code Playgroud)
我不知道为什么屏蔽数组函数移动得如此缓慢,但由于听起来您正在使用屏蔽来选择行(而不是单个值),因此您可以从屏蔽行创建一个常规数组并使用 np 函数反而:
b.mask = np.zeros(500)
b.mask[498] = True
t = timeit.Timer('c=b.view(np.ndarray)[~b.mask[:,0]]; np.apply_along_axis(test, 1, c)','from __main__ import test, b, ma, np')
print round(t.timeit(100), 6)
Run Code Online (Sandbox Code Playgroud)
更好的是,根本不要使用掩码数组;只需将数据和一维掩码数组维护为单独的变量:
a = np.arange(1000).reshape(500, 2)
mask = np.ones(a.shape[0], dtype=bool)
mask[498] = False
out = np.apply_along_axis(test, 1, a[mask])
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
5027 次 |
| 最近记录: |