在Spark版本1.2.0中,可以使用subtract2 SchemRDD秒来结束与第一个不同的内容
val onlyNewData = todaySchemaRDD.subtract(yesterdaySchemaRDD)
Run Code Online (Sandbox Code Playgroud)
onlyNewData包含todaySchemRDD不存在的行yesterdaySchemaRDD.
如何DataFrames在Spark 1.3.0版本中实现这一目标?