相关疑难解决方法(0)

                    A        B
DATE                 
2013-05-01        473077    71333
2013-05-02         35131    62441
2013-05-03           727    27381
2013-05-04           481     1206
2013-05-05           226     1733
2013-05-06           NaN     4064
2013-05-07           NaN    41151
2013-05-08           NaN     8144
2013-05-09           NaN       23
2013-05-10           NaN       10

Run Code Online (Sandbox Code Playgroud)

说我有上面的数据框.获得具有相同索引的系列的最简单方法是什么,即A列和B列的平均值？平均需要忽略NaN值.扭曲的是,此解决方案需要灵活地向数据框添加新列.

我最接近的是

df.sum(axis=1) / len(df.columns)

Run Code Online (Sandbox Code Playgroud)

但是,这似乎并没有忽略NaN值

(注意:我对熊猫图书馆还有点新意,所以我猜这有一种明显的方法可以做到这一点,我的有限大脑根本就没有看到)

python dataframe pandas

bad*_*eas

lucky-day

28
推荐指数

1
解决办法

7万
查看次数

Pandas .mean()的专栏

我正在尝试查找数据集中其中一列中所有值的平均值.我做了df ["column"].mean()但是它给了我一个可笑的大数字,考虑到我的价值有多小,这个数字没有意义.但是,min()和max()函数运行正常.

这就是我所说的.

为了澄清,第一个单元格中输出的左侧是索引,右侧是值.

delay["If Delayed, for how long?"].astype(int)

print(delay["If Delayed, for how long?"].min())
print(delay["If Delayed, for how long?"].max())
print(delay["If Delayed, for how long?"].mean()

Run Code Online (Sandbox Code Playgroud)

python pandas jupyter-notebook

作者

2018 09-13

-2
推荐指数

1
解决办法

108
查看次数