Pandas group by和sum两列

Question

Pandas group by和sum两列

初学者问题.这似乎应该是一个简单的操作,但我无法从阅读文档中弄清楚.

我有一个这种结构的df:

|integer_id|int_field_1|int_field_2|

Run Code Online (Sandbox Code Playgroud)

integer_id列是非唯一的,所以我想将df按integer_id分组并将两个字段相加.

等效的SQL是:

SELECT integer_id, SUM(int_field_1), SUM(int_field_2) FROM tbl
GROUP BY integer_id

Run Code Online (Sandbox Code Playgroud)

有关最简单方法的任何建议吗？

编辑:包括输入/输出

Input:  
integer_id  int_field_1 int_field_2   
2656        36          36  
2656        36          36  
9702        2           2  
9702        1           1

Run Code Online (Sandbox Code Playgroud)

输出使用df.groupby('integer_id').sum():

integer_id  int_field_1 int_field_2  
2656        72          72  
9702        3           3

Run Code Online (Sandbox Code Playgroud)

Answer 1

EdC*_*ica 10

你只需要调用sum一个groupby对象:

df.groupby('integer_id').sum()

Run Code Online (Sandbox Code Playgroud)

有关更多示例,请参阅文档

归档时间：	11 年，6 月前
查看次数：	13030 次
最近记录：	8 年，2 月前