Vig*_*h I 7 streaming hadoop windowing
据我所知,翻滚窗口是设置一个时间间隔的,并且事件不会重叠并且在设置的时间间隔内到期。现在,跳跃窗口和滑动窗口重叠,在跳跃窗口的情况下,我们有一个跳跃间隔和正常窗口间隔,而滑动窗口有一个不同于窗口间隔的滑动间隔。我查看了跳跃窗口上的这个链接,我理解它,但滑动间隔似乎也相同。有人可以帮我解释其中的区别吗?
小智 8
微软有一个很好的解释(链接)。基本上,跳跃窗口总是从时间序列的开始处前进特定的时间间隔。仅当时间序列中有数据可供评估时,滑动窗口才会前进。
数据集:
跳跃:从时间 T 开始,对 10 秒窗口的值求和,提前 5 秒
滑动:从时间 T 开始,对 10 秒窗口的值求和
跳跃窗口更多地基于计划,在每个时期准确地产生输出。流窗口更多地基于事件,仅当数据存在时才产生输出。
归档时间:
9 年,1 月 前
查看次数:
6425 次
最近记录:
8 年 前