初学者问题.这似乎应该是一个简单的操作,但我无法从阅读文档中弄清楚.
我有一个这种结构的df:
|integer_id|int_field_1|int_field_2|
Run Code Online (Sandbox Code Playgroud)
integer_id列是非唯一的,所以我想将df按integer_id分组并将两个字段相加.
等效的SQL是:
SELECT integer_id, SUM(int_field_1), SUM(int_field_2) FROM tbl
GROUP BY integer_id
Run Code Online (Sandbox Code Playgroud)
有关最简单方法的任何建议吗?
编辑:包括输入/输出
Input:
integer_id int_field_1 int_field_2
2656 36 36
2656 36 36
9702 2 2
9702 1 1
Run Code Online (Sandbox Code Playgroud)
输出使用df.groupby('integer_id').sum():
integer_id int_field_1 int_field_2
2656 72 72
9702 3 3
Run Code Online (Sandbox Code Playgroud)
EdC*_*ica 10
你只需要调用sum
一个groupby
对象:
df.groupby('integer_id').sum()
Run Code Online (Sandbox Code Playgroud)
有关更多示例,请参阅文档