获得numpy中3D阵列的2D切片的平均值

rob*_*ntw 12 arrays numpy mean slice multidimensional-array

我有一个numpy数组,形状为:

(11L, 5L, 5L)
Run Code Online (Sandbox Code Playgroud)

我想计算数组[0,:,],[1,:,]等的每个'切片'的25个元素的平均值,返回11个值.

这看起来很傻,但我无法弄清楚如何做到这一点.我认为这个mean(axis=x)函数可以做到这一点,但我已经尝试了所有可能的轴组合,但没有一个给我我想要的结果.

我显然可以使用for循环和切片来做到这一点,但肯定有更好的方法吗?

J. *_*rde 15

使用轴的元组:

>>> a = np.arange(11*5*5).reshape(11,5,5)
>>> a.mean(axis=(1,2))
array([  12.,   37.,   62.,   87.,  112.,  137.,  162.,  187.,  212.,
        237.,  262.])
Run Code Online (Sandbox Code Playgroud)

编辑:这只适用于numpy版本1.7+.

  • 有用?人们会认为1.7和之后,但文档仍然只说一个轴. (2认同)
  • 很酷,不知道这已被添加! (2认同)

Sau*_*tro 5

您可以reshape(11, 25)然后mean仅拨打一次(更快):

a.reshape(11, 25).mean(axis=1)
Run Code Online (Sandbox Code Playgroud)

或者,您可以拨打np.mean两次(在我的计算机上,通话速度大约慢2倍):

a.mean(axis=2).mean(axis=1)
Run Code Online (Sandbox Code Playgroud)


Dan*_*iel 5

总是可以使用np.einsum:

>>> a = np.arange(11*5*5).reshape(11,5,5)
>>> np.einsum('...ijk->...i',a)/(a.shape[-1]*a.shape[-2])
array([ 12,  37,  62,  87, 112, 137, 162, 187, 212, 237, 262])
Run Code Online (Sandbox Code Playgroud)

适用于更高维数组(如果更改了轴标签,则所有这些方法都适用):

>>> a = np.arange(10*11*5*5).reshape(10,11,5,5)
>>> (np.einsum('...ijk->...i',a)/(a.shape[-1]*a.shape[-2])).shape
(10, 11)
Run Code Online (Sandbox Code Playgroud)

更快启动:

a = np.arange(11*5*5).reshape(11,5,5)

%timeit a.reshape(11, 25).mean(axis=1)
10000 loops, best of 3: 21.4 us per loop

%timeit a.mean(axis=(1,2))
10000 loops, best of 3: 19.4 us per loop

%timeit np.einsum('...ijk->...i',a)/(a.shape[-1]*a.shape[-2])
100000 loops, best of 3: 8.26 us per loop
Run Code Online (Sandbox Code Playgroud)

随着阵列大小的增加,比其他方法稍微好一点.

使用dtype=np.float64不会明显改变上述时间,所以只需要仔细检查:

a = np.arange(110*50*50,dtype=np.float64).reshape(110,50,50)

%timeit a.reshape(110,2500).mean(axis=1)
1000 loops, best of 3: 307 us per loop

%timeit a.mean(axis=(1,2))
1000 loops, best of 3: 308 us per loop

%timeit np.einsum('...ijk->...i',a)/(a.shape[-1]*a.shape[-2])
10000 loops, best of 3: 145 us per loop
Run Code Online (Sandbox Code Playgroud)

还有一些有趣的事情:

%timeit np.sum(a) #37812362500.0
100000 loops, best of 3: 293 us per loop

%timeit np.einsum('ijk->',a) #37812362500.0
100000 loops, best of 3: 144 us per loop
Run Code Online (Sandbox Code Playgroud)