相关疑难解决方法(0)

Spark:减去两个DataFrame

在Spark版本1.2.0中,可以使用subtract2 SchemRDD秒来结束与第一个不同的内容

val onlyNewData = todaySchemaRDD.subtract(yesterdaySchemaRDD)
Run Code Online (Sandbox Code Playgroud)

onlyNewData包含todaySchemRDD不存在的行yesterdaySchemaRDD.

如何DataFrames在Spark 1.3.0版本中实现这一目标?

dataframe apache-spark rdd

42
推荐指数
4
解决办法
7万
查看次数

标签 统计

apache-spark ×1

dataframe ×1

rdd ×1