相关疑难解决方法(0)

如何将Spark中`Dataframe`的两列合并为一个2-Tuple?

我有一个DataFrame df有五列的Spark .我想添加另一列,其值为第一列和第二列的元组.当使用withColumn()方法时,我得到不匹配错误,因为输入不是列类型,而是(列,列).我想知道在这种情况下是否有一个解决方案旁边的行循环运行?

var dfCol=(col1:Column,col2:Column)=>(col1,col2)
val vv = df.withColumn( "NewColumn", dfCol( df(df.schema.fieldNames(1)) , df(df.schema.fieldNames(2)) ) )
Run Code Online (Sandbox Code Playgroud)

scala apache-spark-sql spark-dataframe

9
推荐指数
3
解决办法
2万
查看次数

标签 统计

apache-spark-sql ×1

scala ×1

spark-dataframe ×1