如何在join中选择数据框的所有列 - Spark-scala

use*_*589 6 hadoop scala apache-spark

我正在连接2​​个数据框并选择左框架的所有列,例如:

val join_df = first_df.join(second_df, first_df("id") === second_df("id") , "left_outer")
Run Code Online (Sandbox Code Playgroud)

在上面我想做的选择first_df.*.如何在连接中选择一帧的所有列?

小智 17

使用别名:

first_df.alias("fst").join(second_df, Seq("id"), "left_outer").select("fst.*")
Run Code Online (Sandbox Code Playgroud)