pat*_*ski 5 python dataframe python-3.x pandas
我有一个简单的 DataFrame,如下所示:
date
0 2018-08-28 13:13:37
1 2018-08-28 13:43:31
2 2018-08-28 15:23:25
3 2018-08-28 15:23:30
4 2018-08-28 15:23:33
5 2018-08-28 15:23:34
...
790 2018-09-04 10:45:38
791 2018-09-04 10:45:38
792 2018-09-04 11:13:16
793 2018-09-04 12:12:09
794 2018-09-04 14:01:54
Run Code Online (Sandbox Code Playgroud)
我想将具有相同日期的所有行(小时、分钟和秒并不重要)分组,并使用总和(具有相同日期的合并行数)创建一个新列。
我试图计算出的输出是:
date sum
0 2018-08-28 6
1 2018-08-29 100
2 2018-08-30 100
3 2018-08-31 100
4 2018-09-01 100
5 2018-09-02 100
6 2018-09-03 100
7 2018-09-04 100
Run Code Online (Sandbox Code Playgroud)
我尝试使用groupby 函数,但无法获得正确的输出
使用:
df.groupby(df['date'].dt.date).size().rename(columns={'size':'sum'})
Run Code Online (Sandbox Code Playgroud)
此方法假设Series“日期”已经是 dtype datetime。
pd.read_csv如果通过传递参数“ ”创建 DataFrameparse_dates=['date']或运行以下命令,您可以设置此项:
df['date'] = pd.to_datetime(df['date'])
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
4514 次 |
| 最近记录: |