跳跃与滑动窗口

Vig*_*h I 7 streaming hadoop windowing

据我所知,翻滚窗口是设置一个时间间隔的,并且事件不会重叠并且在设置的时间间隔内到期。现在,跳跃窗口和滑动窗口重叠,在跳跃窗口的情况下,我们有一个跳跃间隔和正常窗口间隔,而滑动窗口有一个不同于窗口间隔的滑动间隔。我查看了跳跃窗口上的这个链接,我理解它,但滑动间隔似乎也相同。有人可以帮我解释其中的区别吗?

小智 8

微软有一个很好的解释(链接)。基本上,跳跃窗口总是从时间序列的开始处前进特定的时间间隔。仅当时间序列中有数据可供评估时,滑动窗口才会前进。

数据集:

  • 时间 T: 18
  • T+1:12
  • T+7:20
  • T+11:15
  • T+16:19
  • T+27:107

跳跃:从时间 T 开始,对 10 秒窗口的值求和,提前 5 秒

  • T-T10:50(18+12+20)
  • T5-T15:35(20+15)
  • T10-T20:24(15+19)
  • T15-T25:19 (19)
  • T20-T30:107

滑动:从时间 T 开始,对 10 秒窗口的值求和

  • 战术:50(18+12+20)
  • T1:47(12+20+15)
  • T7:44(20+15+19)
  • T11:24(15+19)
  • T16:19 (19)
  • T27:107 (107)

跳跃窗口更多地基于计划,在每个时期准确地产生输出。流窗口更多地基于事件,仅当数据存在时才产生输出。