max*_*ijn 4 python dataframe pandas
我有一个以日期和小时为列的熊猫数据框。现在我想添加相同日期的小时数。例如要做到这一点:
7-1-2016 | 4
7-1-2016 | 2
4-1-2016 | 5
Run Code Online (Sandbox Code Playgroud)
进入这个:
7-1-2016 | 6
4-1-2016 | 5
Run Code Online (Sandbox Code Playgroud)
有没有一种快速的方法可以在大文件上做到这一点?
小智 6
这里GroupBy可以用来提供所需的输出。
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False)
Run Code Online (Sandbox Code Playgroud)
使用映射器(字典或键函数,将给定函数应用于组,将结果作为系列返回)或按一系列列对系列进行分组。
尝试:
df.groupby('date')['hours'].sum()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
7536 次 |
| 最近记录: |