我有一个包含 3 列的 pandas DataFrame;时间(日期时间对象)、real_genesis(浮点型)和predicted_ Generation(浮点型)。我创建了第四列“残差”(也是浮点数),即实际生成和预测生成之间的差异。我现在想要检测 5 个连续行的残差何时至少为 0.5。数据框如下所示:
Index Time real_generation predicted_generation residual
0 2019-01-01 10:00:00+00:00 0.0 0.239 0.239
1 2019-01-01 11:00:00+00:00 0.126 0.627 0.501
2 2019-01-01 12:00:00+00:00 0.227 0.833 0.606
3 2019-01-01 13:00:00+00:00 0.230 0.833 0.603
4 2019-01-01 14:00:00+00:00 0.245 0.827 0.582
5 2019-01-01 15:00:00+00:00 0.255 0.756 0.501
6 2019-01-01 16:00:00+00:00 0.260 0.627 0.367
7 2019-01-01 17:00:00+00:00 0.255 0.533 0.278
8 2019-01-01 18:00:00+00:00 0.248 0.427 0.179
9 2019-01-01 19:00:00+00:00 0.124 0.233 0.109
Run Code Online (Sandbox Code Playgroud)
我想创建一个函数来查找这些行并打印每组的第一个索引。这意味着打印索引“1”,因为第 1、2、3、4 和 5 行的残差 > …