相关疑难解决方法(0)

加入后如何避免重复列?

我有两个包含以下列的数据框:

df1.columns
//  Array(ts, id, X1, X2)
Run Code Online (Sandbox Code Playgroud)

df2.columns
//  Array(ts, id, Y1, Y2)
Run Code Online (Sandbox Code Playgroud)

我之后

val df_combined = df1.join(df2, Seq(ts,id))
Run Code Online (Sandbox Code Playgroud)

我最终得到以下列:Array(ts, id, X1, X2, ts, id, Y1, Y2).我可以预期公共列将被删除.有什么额外的东西需要做吗?

scala apache-spark apache-spark-sql

41
推荐指数
5
解决办法
5万
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

scala ×1