CustID UsageDate EnergyConsumed
0 17111 2018-01-01 00:00:00 1.095
1 17111 2018-01-01 01:00:00 1.129
2 17111 2018-01-01 02:00:00 1.165
3 17111 2018-01-01 03:00:00 1.833
4 17111 2018-01-01 04:00:00 1.697
5 17111 2018-01-01 05:00:00 1.835
missing data point 1
6 17111 2018-01-01 07:00:00 1.835
7 17112 2018-01-01 00:00:00 1.095
8 17112 2018-01-01 01:00:00 1.129
missing data point 1
9 17112 2018-01-01 03:00:00 1.833
10 17112 2018-01-01 04:00:00 1.697
11 17112 2018-01-01 05:00:00 1.835
Run Code Online (Sandbox Code Playgroud)
对于每个客户,我都有每小时的数据.但是,两者之间缺少一些数据点.我想检查使用日期的最小值和最大值,并在该时间间隔内填写缺少的使用日期(所有值均为每小时),并且EnergyConsumed为零.我以后可以使用ffill或回填来处理这个问题.
并非每个客户的最大UsageDate都是2018-01-31 23:00:00.所以我们只想将系列扩展到每个客户的最大日期.
缺失点1被替换为
17111 2018-01-01 06:00:00 0
Run Code Online (Sandbox Code Playgroud)
缺失点2被替换为 …