Python 中具有 nan 值的数组之间的平均值

Question

Python 中具有 nan 值的数组之间的平均值

Gia*_*ear 4 python arrays numpy average nan

我在Python中有三个数组

a = np.array([[10., 10., 10., 10.], [10., nan, 10., 10.], [10., 10., nan, 10.]])
b = np.array([[10., 10., 10., 10.], [10., 10., 10., nan], [10., 10.,nan, 10]])
c = np.array([[10., nan, 10., 10.], [nan, 10., 10., nan], [10., 10.,nan, 10]])

Run Code Online (Sandbox Code Playgroud)

我需要计算平均值以获得以下数组：

>>> myavg 
array([[ 10.,  10,  10.,  10.],
       [ 10,  10.,  10.,  10.],
       [ 10.,  10.,  nan,  10.]])

Run Code Online (Sandbox Code Playgroud)

第一步是转换新的 [0,1] 数组中的数组并求和（即 3 = 每个数组中的数据，2 = 仅两个数组中的数据，1 = 多个数组中的数据，0 = 无数据）

aa = a.copy()
bb = b.copy()
cc = c.copy()
aa[aa == 10.] = 1
aa[aa != 1] = 0
bb[bb == 10.] = 1
bb[bb != 1] = 0
cc[cc == 10.] = 1
cc[cc != 1] = 0
dd = aa + bb + cc

>>> dd
array([[ 3.,  2.,  3.,  3.],
       [ 2.,  2.,  3.,  1.],
       [ 3.,  3.,  0.,  3.]])

Run Code Online (Sandbox Code Playgroud)

第二个是所有原始数组的总和，然后除以 dd

c = a+b+c
>>> c
array([[ 30.,  nan,  30.,  30.],
       [ nan,  nan,  30.,  nan],
       [ 30.,  30.,  nan,  30.]])

Run Code Online (Sandbox Code Playgroud)

问题是很明显的。当我将一个值与 nan 相加时，我得到 nan。我无法将 nan 转换为“0”，因为在我的实际情况下 0 是一个值（即温度）

Answer 1

War*_*ser 5

您可以将a,b和c放入一个3维数组中，然后使用numpy.nanmean：

In [2]: %paste
a = np.array([[10., 10., 10., 10.], [10., nan, 10., 10.], [10., 10., nan, 10.]])
b = np.array([[10., 10., 10., 10.], [10., 10., 10., nan], [10., 10.,nan, 10]])
c = np.array([[10., nan, 10., 10.], [nan, 10., 10., nan], [10., 10.,nan, 10]])

## -- End pasted text --

In [3]: m = np.array([a, b, c])

In [4]: np.nanmean(m, axis=0)
/Users/warren/anaconda/lib/python2.7/site-packages/numpy/lib/nanfunctions.py:675: RuntimeWarning: Mean of empty slice
  warnings.warn("Mean of empty slice", RuntimeWarning)
Out[4]: 
array([[ 10.,  10.,  10.,  10.],
       [ 10.,  10.,  10.,  10.],
       [ 10.,  10.,  nan,  10.]])

Run Code Online (Sandbox Code Playgroud)

出现警告是因为在一种情况下，所有求平均值的值都是 nan。

归档时间：	9 年，10 月前
查看次数：	2040 次
最近记录：	9 年，10 月前