如何使用“命名聚合”

Question

如何使用“命名聚合”

我想在 Pandas DataFrameGroupBy 的同一列上应用两个不同的聚合，并命名新列。

我已经尝试使用文档中显示的内容。 https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html#named-aggregation

In [82]: animals.groupby("kind").agg(
   ....:     min_height=('height', 'min'),
   ....:     max_height=('height', 'max'),
   ....:     average_weight=('weight', np.mean),
   ....: )
   ....: 
Out[82]: 
      min_height  max_height  average_weight
kind                                        
cat          9.1         9.5            8.90
dog          6.0        34.0          102.75

Run Code Online (Sandbox Code Playgroud)

我正在尝试做的事情是：

df = pd.DataFrame({"year": [2001, 2001, 2001, 2005, 2005],
                   "value": [1, 2, 5, 3, 1]})

df = df.groupby("year").agg(sum=('value', 'sum'),
                            count=('value', 'size'))

Run Code Online (Sandbox Code Playgroud)

但是，这给出了以下内容：

TypeError: aggregate() missing 1 required positional argument: 'arg'

Run Code Online (Sandbox Code Playgroud)

Answer 1

WeN*_*Ben 5

由于您需要为一列使用两个 aggfunction，因此您可能需要传递到列表，就像您没有更新pandas到 0.25.0 一样

df = df.groupby("year").value.agg(['sum','count'])
df
      sum  count
year            
2001    8      3
2005    4      2

Run Code Online (Sandbox Code Playgroud)

在pandas0.25.0

pd.__version__
'0.25.0'
df = df.groupby("year").agg(sum=('value', 'sum'),
                            count=('value', 'count'))
df
      sum  count
year            
2001    8      3
2005    4      2

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，4 月前
查看次数：	6082 次
最近记录：	6 年，4 月前