Python 中具有 nan 值的数组之间的平均值

Gia*_*ear 4 python arrays numpy average nan

我在Python中有三个数组

a = np.array([[10., 10., 10., 10.], [10., nan, 10., 10.], [10., 10., nan, 10.]])
b = np.array([[10., 10., 10., 10.], [10., 10., 10., nan], [10., 10.,nan, 10]])
c = np.array([[10., nan, 10., 10.], [nan, 10., 10., nan], [10., 10.,nan, 10]])
Run Code Online (Sandbox Code Playgroud)

我需要计算平均值以获得以下数组:

>>> myavg 
array([[ 10.,  10,  10.,  10.],
       [ 10,  10.,  10.,  10.],
       [ 10.,  10.,  nan,  10.]])
Run Code Online (Sandbox Code Playgroud)

第一步是转换新的 [0,1] 数组中的数组并求和(即 3 = 每个数组中的数据,2 = 仅两个数组中的数据,1 = 多个数组中的数据,0 = 无数据)

aa = a.copy()
bb = b.copy()
cc = c.copy()
aa[aa == 10.] = 1
aa[aa != 1] = 0
bb[bb == 10.] = 1
bb[bb != 1] = 0
cc[cc == 10.] = 1
cc[cc != 1] = 0
dd = aa + bb + cc

>>> dd
array([[ 3.,  2.,  3.,  3.],
       [ 2.,  2.,  3.,  1.],
       [ 3.,  3.,  0.,  3.]])
Run Code Online (Sandbox Code Playgroud)

第二个是所有原始数组的总和,然后除以 dd

c = a+b+c
>>> c
array([[ 30.,  nan,  30.,  30.],
       [ nan,  nan,  30.,  nan],
       [ 30.,  30.,  nan,  30.]])
Run Code Online (Sandbox Code Playgroud)

问题是很明显的。当我将一个值与 nan 相加时,我得到 nan。我无法将 nan 转换为“0”,因为在我的实际情况下 0 是一个值(即温度)

War*_*ser 5

您可以将a,bc放入一个3维数组中,然后使用numpy.nanmean

In [2]: %paste
a = np.array([[10., 10., 10., 10.], [10., nan, 10., 10.], [10., 10., nan, 10.]])
b = np.array([[10., 10., 10., 10.], [10., 10., 10., nan], [10., 10.,nan, 10]])
c = np.array([[10., nan, 10., 10.], [nan, 10., 10., nan], [10., 10.,nan, 10]])

## -- End pasted text --

In [3]: m = np.array([a, b, c])

In [4]: np.nanmean(m, axis=0)
/Users/warren/anaconda/lib/python2.7/site-packages/numpy/lib/nanfunctions.py:675: RuntimeWarning: Mean of empty slice
  warnings.warn("Mean of empty slice", RuntimeWarning)
Out[4]: 
array([[ 10.,  10.,  10.,  10.],
       [ 10.,  10.,  10.,  10.],
       [ 10.,  10.,  nan,  10.]])
Run Code Online (Sandbox Code Playgroud)

出现警告是因为在一种情况下,所有求平均值的值都是 nan。