I.K*_*kyi 3 python aggregate-functions timedelta dataframe
我有一个大 DataFrame (df),如下所示:
Acc_num date_diff 0 29 0:04:43 1 29 0:01:43 2 29 2:22:45 3 29 0:16:21 4月29日 0:58:20 5 30 0:00:35 6 34 7:15:26 7 34 4:40:01 8 34 0:56:02 9 34 6:53:44 10 34 1:36:58 …… Acc_num int64 date_diff timedelta64[ns] 数据类型:对象
我需要计算每个帐号的“date_diff”平均值(以 timedelta 格式)。
df.date_diff.mean()工作正常。但是当我尝试下一步时:
df.groupby('Acc_num').date_diff.mean()它引发了一个异常:
“数据错误:没有要聚合的数字类型”
我也尝试过df.pivot_table()方法,但没有取得任何成果。
有人可以帮我解决这个问题吗?先感谢您!
确实很奇怪的限制。但一个简单的解决方案是:
df.groupby('Acc_num').date_diff.agg(lambda g:g.sum()/g.count())
Run Code Online (Sandbox Code Playgroud)
编辑:
如果您通过,Pandas 实际上会尝试聚合非数字列numeric_only=False
df.groupby('Acc_num').date_diff.mean(numeric_only=False)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3120 次 |
| 最近记录: |