当结果依赖于前一个单元格时,如何将函数应用于数组的每个元素

leo*_*lds 4 python arrays numpy

我有一个数组:

a = np.array([2,3,5,8,3,5])
Run Code Online (Sandbox Code Playgroud)

什么是计算数组的最有效(矢量化)方法,其中每个结果元素是(伪代码):

result[0] = a[0]
for i > 0:
    result[i] = result[i-1] + (a[i] - result[i-1]) * factor
Run Code Online (Sandbox Code Playgroud)

我可以使用以下低效代码(因子= 0.5)执行此操作:

a = np.array([2,3,5,8,3,5])
result = np.array([a[0]])
for k in a[1:]:
   result = np.append(result, result[-1]+(k-result[-1])*0.5)
Run Code Online (Sandbox Code Playgroud)

这种阻尼功能的结果是:

array([ 2.,  2.5,  3.75,  5.875,  4.4375,  4.71875])
Run Code Online (Sandbox Code Playgroud)

awe*_*oon 6

您正在寻找Haskell scanl1在Python中的替代方案(Haskell示例):

Prelude> scanl1 (\a  b -> a + (b - a) * 0.5) [2, 3, 5, 8, 3, 5]
[2.0,2.5,3.75,5.875,4.4375,4.71875]
Run Code Online (Sandbox Code Playgroud)

模块中有一个accumulate功能itertools:

In [1]: import itertools

In [2]: itertools.accumulate([2, 3, 5, 8, 3, 5], lambda a, b: a + (b - a) * 0.5)
Out[2]: <itertools.accumulate at 0x7f1fc1fc1608>

In [3]: list(itertools.accumulate([2, 3, 5, 8, 3, 5], lambda a, b: a + (b - a) * 0.5))
Out[3]: [2, 2.5, 3.75, 5.875, 4.4375, 4.71875]
Run Code Online (Sandbox Code Playgroud)

使用NumPy,您可以使用numpy.ufunc.accumulate函数,但是,根据这个答案,实现中存在一个错误,这就是我们应该使用强制转换的原因.不幸的是,我对NumPy不是很熟悉,而且可能有更好的方法:

In [9]: import numpy as np

In [10]: uf = np.frompyfunc(lambda a, b: a + (b - a) * 0.5, 2, 1)

In [11]: uf.accumulate([2,3,5,8,3,5], dtype=np.object).astype(np.float)
Out[11]: array([ 2.     ,  2.5    ,  3.75   ,  5.875  ,  4.4375 ,  4.71875])
Run Code Online (Sandbox Code Playgroud)