小编gro*_*eck的帖子

滑动与翻滚Windows

我正在阅读一篇关于数据流管理的长篇文章,我对Sliding和Tumbling Windows之间的区别感到有些困惑.到目前为止,我已经明白翻滚窗口可以是基于时间的,并且具有固定的(开始,结束)点,当该窗口到期时,这些点会"翻滚".例如,基于时间的窗口可以是1分钟长.因此,对于每分钟,窗口都会翻滚以处理数据集的聚合.

滑动的窗户让我很困惑.滑动窗口是否像基于计数一样,当x元组的数量进入窗口时,窗口会翻滚.或者是进入窗口的x-recent元组将成为窗口的一部分,并且旧的元组将从该窗口逐出.即随着新元组的到来不断更新的窗口?

streaming

18
推荐指数
2
解决办法
1万
查看次数

(Twitter)风暴的聚合窗口

我正在玩Storm,我想知道Storm在聚合时指定(如果可能)窗口大小(如果可能).例如,如果我们想在Twitter上找到前一小时的热门话题.我们如何指定螺栓应该每小时返回结果?这是以编程方式在每个螺栓内完成的吗?或者是指定"窗口"的某种方式?

real-time-data real-time-systems apache-storm

7
推荐指数
1
解决办法
4561
查看次数