尝试将多个函数聚合到新列时意外的KeyError Pandas

Tah*_*sha 4 python dictionary aggregate dataframe pandas

我看了下面的问题:

将多个函数应用于多个groupby列

我有数据

                    p.date p.instrument                p.sector  \
11372  2013-02-15 00:00:00            A             Health Care   
11373  2013-02-15 00:00:00           AA               Materials   
11374  2013-02-15 00:00:00         AAPL  Information Technology   
11375  2013-02-15 00:00:00         ABBV             Health Care   
11376  2013-02-15 00:00:00          ABC             Health Care   

                                p.industry    p.retn  p.pfwt     b.bwt  
11372     Health Care Equipment & Services -5.232929     NaN  0.000832  
11373                             Aluminum  0.328947     NaN  0.000907  
11374                    Computer Hardware -1.373927     NaN  0.031137  
11375                      Pharmaceuticals  2.756020     NaN  0.004738  
11376  Health Care Distribution & Services -0.371179     NaN  0.000859 
Run Code Online (Sandbox Code Playgroud)

但是当我尝试:

test1.groupby("p.sector").agg({'r1': lambda x: x['p.pfwt'].sum()})
Run Code Online (Sandbox Code Playgroud)

我收到了错误

KeyError: 'r1'
Run Code Online (Sandbox Code Playgroud)

我正在尝试使用当前DataFrame的一组结果创建新列.

我错过了什么?谢谢

joa*_*uin 6

使用

test1.groupby("p.sector").agg({'p.pfwt': np.sum})
Run Code Online (Sandbox Code Playgroud)

这个pandas docs为例.

  • 聚合字典中的键必须与数据帧中的预先存在的键相对应.您的程序失败,因为您的数据框中没有"r1"列,因此它无法聚合不存在的内容.
  • 如果您需要重命名结果,那么您可以为这样的系列添加链式操作: .agg([np.sum, np.mean, np.std]).rename(columns={'sum': 'foo', 'mean': 'bar', 'std': 'baz'}) )