小编wtt*_*ttt的帖子

Spark scala数据框udf返回行

假设我有一个包含一列(称为colA)的数据帧,该列是行的seq.我想在每个colA记录中添加一个新字段.(并且新的文件与前一个记录有关,所以我必须写一个udf.)我应该怎么写这个udf?

我试图编写一个udf,它将colA作为输入,并输出Seq [Row],其中每个记录包含新的字段.但问题是udf无法返回Seq [Row] /异常是'Schema for type org.apache.spark.sql.Row不受支持'.我该怎么办?

我写的udf: val convert = udf[Seq[Row], Seq[Row]](blablabla...) 异常是java.lang.UnsupportedOperationException:不支持类型为org.apache.spark.sql.Row的Schema

scala user-defined-functions apache-spark

6
推荐指数
1
解决办法
2245
查看次数