小编Tim*_*Tee的帖子

Pandas groupby mean() 不忽略 NaN

如果我计算 groupby 对象的平均值,并且在其中一个组中存在 NaN(s),则忽略 NaN。即使在应用 np.mean 时,它仍然只返回所有有效数字的平均值。我希望一旦一个 NaN 在组内,就会出现返回 NaN 的行为。这是行为的简化示例

import pandas as pd
import numpy as np
c = pd.DataFrame({'a':[1,np.nan,2,3],'b':[1,2,1,2]})
c.groupby('b').mean()
     a
b     
1  1.5
2  3.0
c.groupby('b').agg(np.mean)
     a
b     
1  1.5
2  3.0
Run Code Online (Sandbox Code Playgroud)

我想收到以下结果:

     a
b     
1  1.5
2  NaN
Run Code Online (Sandbox Code Playgroud)

我知道我可以预先替换 NaN 并且我可能可以编写自己的聚合函数以在 NaN 在组内时立即返回 NaN。不过这个功能不会被优化。

您是否知道使用优化函数实现所需行为的参数?

顺便说一句,我认为所需的行为是在以前版本的熊猫中实现的。

python nan dataframe pandas

4
推荐指数
2
解决办法
2万
查看次数

标签 统计

dataframe ×1

nan ×1

pandas ×1

python ×1