我想获得数据帧中行的平均值,其中我只使用大于或等于零的值.
例如:如果我的数据框看起来像:
df = pd.DataFrame([[3,4,5], [4,5,6],[4,-10,6]])
3 4 5
4 5 6
4 -10 6
Run Code Online (Sandbox Code Playgroud)
目前,如果我得到我写的行的平均值:
df['mean'] = df.mean(axis = 1)
Run Code Online (Sandbox Code Playgroud)
得到:
3 4 5 4
4 5 6 5
4 -10 6 0
Run Code Online (Sandbox Code Playgroud)
我想获得一个只使用大于零的值来计算平均值的数据帧.我想要一个看起来像这样的数据帧:
3 4 5 4
4 5 6 5
4 -10 6 5
Run Code Online (Sandbox Code Playgroud)
在上面的例子中,-10被排除在平均值之外.是否有一个排除-10的命令?
您可以df[df > 0]在计算平均值之前使用查询数据框; df[df > 0]返回一个数据框,其中小于或等于零的单元格将被替换,NaN并在计算时被忽略mean:
df[df > 0].mean(1)
#0 4.0
#1 5.0
#2 5.0
#dtype: float64
Run Code Online (Sandbox Code Playgroud)