pandas 数据框中多列的聚合

Sae*_*eed 2 python group-by dataframe pandas pandas-groupby

数据:

z = pd.DataFrame({'a':[1,1,1,2,2,3,3],'b':[3,4,5,6,7,8,9], 'c':[10,11,12,13,14,15,16]})
Run Code Online (Sandbox Code Playgroud)

我的代码:

gbz = z.groupby('a')
f1 = lambda x: x.loc[x['b'] > 4]['c'].mean()
f2 = lambda x: x.mean()
f3 = {'I don't know what should I write here':{'name1':f1}, 'b':{'name2': f2}}
list1 = gbz.agg(f3)
Run Code Online (Sandbox Code Playgroud)

问题:

如何在函数“f1”中使用多个列?(该函数需要groupby对象的两列)

预期结果:

     name1  name2
1    12.0   4
2    13.5   6.5
3    15.5   8.5
Run Code Online (Sandbox Code Playgroud)

Psi*_*dom 5

agg函数中的嵌套字典已被弃用。您可能会做的是groupby.apply为每个组使用并返回正确索引的系列以进行重命名:

(z.groupby('a')
  .apply(lambda g: pd.Series({
    'name1': g.c[g.b > 4].mean(),
    'name2': g.b.mean()
})))

#  name1    name2
#a      
#1  12.0    4.0
#2  13.5    6.5
#3  15.5    8.5
Run Code Online (Sandbox Code Playgroud)