我有以下数据帧df:
TIME DELAY
0 2016-01-01 06:30:00 0
1 2016-01-01 14:10:00 2
2 2016-01-01 07:05:00 2
3 2016-01-01 11:00:00 1
4 2016-01-01 10:40:00 0
5 2016-01-01 08:10:00 7
6 2016-01-01 11:35:00 2
7 2016-01-02 13:50:00 2
8 2016-01-02 14:50:00 4
9 2016-01-02 14:05:00 1
Run Code Online (Sandbox Code Playgroud)
请注意,行不是按日期时间对象排序的。
对于每一行,我想知道过去 2 小时的平均延迟。为了完成这个任务,我执行了以下代码:
df.index = pd.DatetimeIndex(df["TIME"])
df["DELAY_LAST2HOURS"] = df["DELAY"].rolling("2H").mean()
Run Code Online (Sandbox Code Playgroud)
但是我收到了这个错误:
ValueError: index must be monotonic
Run Code Online (Sandbox Code Playgroud)
我怎样才能正确地解决我的任务?
jez*_*ael 14
问题是DatetimeIndex没有排序,所以需要DataFrame.sort_index:
df.index = pd.DatetimeIndex(df["TIME"])
df = df.sort_index()
df["DELAY_LAST2HOURS"] = df["DELAY"].rolling("2H").mean()
print (df)
TIME DELAY DELAY_LAST2HOURS
TIME
2016-01-01 06:30:00 2016-01-01 06:30:00 0 0.000000
2016-01-01 07:05:00 2016-01-01 07:05:00 2 1.000000
2016-01-01 08:10:00 2016-01-01 08:10:00 7 3.000000
2016-01-01 10:40:00 2016-01-01 10:40:00 0 0.000000
2016-01-01 11:00:00 2016-01-01 11:00:00 1 0.500000
2016-01-01 11:35:00 2016-01-01 11:35:00 2 1.000000
2016-01-01 14:10:00 2016-01-01 14:10:00 2 2.000000
2016-01-02 13:50:00 2016-01-02 13:50:00 2 2.000000
2016-01-02 14:05:00 2016-01-02 14:05:00 1 1.500000
2016-01-02 14:50:00 2016-01-02 14:50:00 4 2.333333
Run Code Online (Sandbox Code Playgroud)
如果没有必要,所有一起应该是原始TIME列:
df["TIME"] = pd.to_datetime(df["TIME"])
df = df.set_index('TIME').sort_index()
df["DELAY_LAST2HOURS"] = df["DELAY"].rolling("2H").mean()
print (df)
DELAY DELAY_LAST2HOURS
TIME
2016-01-01 06:30:00 0 0.000000
2016-01-01 07:05:00 2 1.000000
2016-01-01 08:10:00 7 3.000000
2016-01-01 10:40:00 0 0.000000
2016-01-01 11:00:00 1 0.500000
2016-01-01 11:35:00 2 1.000000
2016-01-01 14:10:00 2 2.000000
2016-01-02 13:50:00 2 2.000000
2016-01-02 14:05:00 1 1.500000
2016-01-02 14:50:00 4 2.333333
Run Code Online (Sandbox Code Playgroud)
编辑:
df["TIME"] = pd.to_datetime(df["TIME"])
df = df.sort_values('TIME').set_index('TIME')
df["DELAY_LAST2HOURS"] = df["DELAY"].rolling("2H").mean()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
7916 次 |
| 最近记录: |