我刚刚开始使用Scala的Apache Flink.有人可以告诉我如何从我当前的数据流创建滞后流(滞后k事件或k单位时间)?
基本上,我想在数据流上实现自动回归模型(在流上使用时间滞后版本的线性回归).因此,需要一种类似于以下伪代码的方法.
val ds : DataStream = ...
val laggedDS : DataStream = ds.map(lag _)
def lag(ds : DataStream, k : Time) : DataStream = {
}
Run Code Online (Sandbox Code Playgroud)
如果每个事件的间隔为1秒,并且有2秒的延迟,我希望样本输入和输出如下.
输入:1,2,3,4,5,6,7 ...
输出:NA,NA,1,2,3,4,5 ......