我正在阅读一篇关于数据流管理的长篇文章,我对Sliding和Tumbling Windows之间的区别感到有些困惑.到目前为止,我已经明白翻滚窗口可以是基于时间的,并且具有固定的(开始,结束)点,当该窗口到期时,这些点会"翻滚".例如,基于时间的窗口可以是1分钟长.因此,对于每分钟,窗口都会翻滚以处理数据集的聚合.
滑动的窗户让我很困惑.滑动窗口是否像基于计数一样,当x元组的数量进入窗口时,窗口会翻滚.或者是进入窗口的x-recent元组将成为窗口的一部分,并且旧的元组将从该窗口逐出.即随着新元组的到来不断更新的窗口?
我正在玩Storm,我想知道Storm在聚合时指定(如果可能)窗口大小(如果可能).例如,如果我们想在Twitter上找到前一小时的热门话题.我们如何指定螺栓应该每小时返回结果?这是以编程方式在每个螺栓内完成的吗?或者是指定"窗口"的某种方式?