在Python Pandas中查找ID的最小值,最大值和平均值

Tas*_*sos 4 python pandas

我在Python Pandas中有两个Dataframe.让我们说第一个是df1.id列没有必要排序.

   id  B  C
0   1  5  1
1   1  5  1
2   1  6  1
3   1  7  1
4   2  5  1
5   2  6  1
6   2  6  1
7   3  7  1
8   3  7  1
9   4  6  1
10  4  7  1
11  4  7  1
Run Code Online (Sandbox Code Playgroud)

然后第二个数据帧df2有一个具有唯一值的列id

   id
0   1
1   2
2   3
3   4
Run Code Online (Sandbox Code Playgroud)

我想计算B每列的最小值,最大值和平均值,id并将其添加到第二个数据帧.结果将是这样的:

   id  min  max  avg
0   1   5    7   5.75
1   2  ..
2   3  ..
3   4  ..
Run Code Online (Sandbox Code Playgroud)

在这个例子中,我能够通过为每个id手册计算它们来复制它.这不是问题,因为该示例只有4个ID.但我的真实例子有超过1000个ID.有没有自动方法呢?

Zer*_*ero 9

agg在组上使用功能

In [96]: df.groupby('id')['B'].agg([pd.np.min, pd.np.max, pd.np.mean])
Out[96]:
    amin  amax      mean
id
1      5     7  5.750000
2      5     6  5.666667
3      7     7  7.000000
4      6     7  6.666667
Run Code Online (Sandbox Code Playgroud)

  • 你可以在这里做`df.groupby('id')['B'].agg(['min','max','mean'])` (4认同)