在 Pandas 数据框中添加具有相同列值的行

max*_*ijn 4 python dataframe pandas

我有一个以日期和小时为列的熊猫数据框。现在我想添加相同日期的小时数。例如要做到这一点:

7-1-2016 | 4
7-1-2016 | 2
4-1-2016 | 5
Run Code Online (Sandbox Code Playgroud)

进入这个:

7-1-2016 | 6
4-1-2016 | 5
Run Code Online (Sandbox Code Playgroud)

有没有一种快速的方法可以在大文件上做到这一点?

小智 6

这里GroupBy可以用来提供所需的输出。

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False)
Run Code Online (Sandbox Code Playgroud)

使用映射器(字典或键函数,将给定函数应用于组,将结果作为系列返回)或按一系列列对系列进行分组。

尝试:

df.groupby('date')['hours'].sum()
Run Code Online (Sandbox Code Playgroud)