Spark流式传输:批处理间隔与窗口

Nor*_*mal 5 apache-spark spark-streaming

我有火花流应用程序,它消耗kafka消息.我想要处理所有最后10分钟的消息.看起来有两种方法可以完成工作:

val ssc = new StreamingContext(new SparkConf(), Minutes(10))
val dstream = ....
Run Code Online (Sandbox Code Playgroud)

val ssc = new StreamingContext(new SparkConf(), Seconds(1))
val dstream = ....
dstream.window(Minutes(10), Minutes(10))
Run Code Online (Sandbox Code Playgroud)

我只想澄清它们之间是否有任何性能差异