小编Car*_*lli的帖子

Spark Java - 将多列收集到数组列中

我有一个包含多列的数据框:

| a | b | c | d |
-----------------
| 0 | 4 | 3 | 6 |
| 1 | 7 | 0 | 4 |
| 2 | 4 | 3 | 6 |
| 3 | 9 | 5 | 9 |
Run Code Online (Sandbox Code Playgroud)

我现在想合并[b,c,d]到一个列中。但是,我不知道列的列表有多大,否则我只能使用 UDF3 将三者结合起来。

所以想要的结果是:

| a | combined  |
-----------------
| 0 | [4, 3, 6] |
| 1 | [7, 0, 4] |
| 2 | [4, 3, …
Run Code Online (Sandbox Code Playgroud)

java apache-spark apache-spark-dataset

5
推荐指数
1
解决办法
2339
查看次数

标签 统计

apache-spark ×1

apache-spark-dataset ×1

java ×1