如何在 Spark Dataframe 中添加列

A.H*_*DAD 2 apache-spark apache-spark-sql

Dataframe.withColumns()仅在数据框末尾附加一个新列,但是我需要一种方法来添加它。

那可能吗 ?

或者唯一的解决方案是使用我的列创建一个数据框,然后附加其余部分?

Bi *_*ico 6

Spark 中没有“前置列”,但您可以使用以下命令对列重新排序select

在Python中:

df.withColumn("column_name", ...).select("column_name", *df.columns)
Run Code Online (Sandbox Code Playgroud)

在斯卡拉:

df.withColumn("column_name", ...).select("column_name", df.columns:_*)
Run Code Online (Sandbox Code Playgroud)

  • @A.HADDAD:如果你使用的是scala,你可以执行`df.columns:_*`。 (2认同)