我在Python Pandas中有两个Dataframe.让我们说第一个是df1.id列没有必要排序.
id B C
0 1 5 1
1 1 5 1
2 1 6 1
3 1 7 1
4 2 5 1
5 2 6 1
6 2 6 1
7 3 7 1
8 3 7 1
9 4 6 1
10 4 7 1
11 4 7 1
Run Code Online (Sandbox Code Playgroud)
然后第二个数据帧df2有一个具有唯一值的列id
id
0 1
1 2
2 3
3 4
Run Code Online (Sandbox Code Playgroud)
我想计算B每列的最小值,最大值和平均值,id并将其添加到第二个数据帧.结果将是这样的:
id min max avg
0 1 5 7 5.75
1 2 ..
2 3 ..
3 4 ..
Run Code Online (Sandbox Code Playgroud)
在这个例子中,我能够通过为每个id手册计算它们来复制它.这不是问题,因为该示例只有4个ID.但我的真实例子有超过1000个ID.有没有自动方法呢?
agg在组上使用功能
In [96]: df.groupby('id')['B'].agg([pd.np.min, pd.np.max, pd.np.mean])
Out[96]:
amin amax mean
id
1 5 7 5.750000
2 5 6 5.666667
3 7 7 7.000000
4 6 7 6.666667
Run Code Online (Sandbox Code Playgroud)