在 groupby 之后需要有关 agg 功能的帮助以进行最后的操作 - 首先

BAR*_*RUN 4 dataframe python-3.x pandas pandas-groupby

我在熊猫数据框下面。

  group   A   B   C   D   E
0    g1  12  14  26  68  83
1    g1  56  58  67  34  97
2    g1  47  87  23  87  90
3    g2  43  76  98  32  78
4    g2  32  56  36  87  65
5    g2  54  12  24  45  95
Run Code Online (Sandbox Code Playgroud)

我希望将 groupby 应用到同一列“group”上,并希望应用聚合函数来获取(最后一个 - 首先)列“E”。

预期输出:

  group   A   B    C   D  E
0    g1  12  87  116  34  7
1    g2  43  12  158  32  17
Run Code Online (Sandbox Code Playgroud)

我写了下面的代码。但它不起作用。

import pandas as pd

df = pd.DataFrame([["g1", 12, 14, 26, 68, 83], ["g1", 56, 58, 67, 34, 97], ["g1", 47, 87, 23, 87, 90], ["g2", 43, 76, 98, 32, 78], ["g2", 32, 56, 36, 87, 65], ["g2", 54, 12, 24, 45, 95]], columns=["group", "A", "B", "C", "D", "E"])
ndf = df.groupby(["group"], as_index=False).agg({"A": 'first', "B": 'last', "C": 'sum', "D": 'min', "E": 'last - first'})
print(df)
print(ndf)
Run Code Online (Sandbox Code Playgroud)

Dan*_*l R 6

您可以lambda为此使用一个函数。

ndf = (
    df.groupby(["group"], as_index=False)
    .agg({"A": 'first',
          "B": 'last',
          "C": 'sum',
          "D": 'min',
          "E": lambda x: x.iat[-1]-x.iat[0]})
)
Run Code Online (Sandbox Code Playgroud)

会输出

  group   A   B    C   D   E
0    g1  12  87  116  34   7
1    g2  43  12  158  32  17
Run Code Online (Sandbox Code Playgroud)