我正在做一个分类问题,其中我试图预测第二天是否会给汽车加油。
数据由日期,每个汽车的ID和指示该特定日期是否为汽车加油的虚拟变量组成。
我要实现的是“ days_since_refuelled”列。这应该被计算为自最后一次加油以来的天数== 1,并且显然必须针对每个car_id分别计算。如果以前没有加油== 1的实例,则该值应等于-1。
所需的输出应如下所示:
date car_id refuelled days_since_refuelled
01-01-2019 1 0 -1
01-01-2019 2 1 -1
01-01-2019 3 1 -1
06-01-2019 1 0 -1
06-01-2019 2 0 5
06-01-2019 3 0 5
09-01-2019 1 1 -1
09-01-2019 2 0 8
09-01-2019 3 0 8
14-01-2019 1 0 5
14-01-2019 2 1 13
14-01-2019 3 0 13
Run Code Online (Sandbox Code Playgroud)