小编laz*_*der的帖子

将数组列转换为 PySpark 数据帧中的结构数组

我有一个包含 3 列的数据框

| str1      | array_of_str1        | array_of_str2  |
+-----------+----------------------+----------------+
| John      | [Size, Color]        | [M, Black]     |
| Tom       | [Size, Color]        | [L, White]     |
| Matteo    | [Size, Color]        | [M, Red]       |
Run Code Online (Sandbox Code Playgroud)

我想添加包含结构类型中 3 列的 Array 列

| str1      | array_of_str1        | array_of_str2  | concat_result                                 |
+-----------+----------------------+----------------+-----------------------------------------------+
| John      | [Size, Color]        | [M, Black]     | [[[John, Size , M], [John, Color, Black]]]    |
| Tom       | [Size, Color]        | [L, White]     | [[[Tom, …
Run Code Online (Sandbox Code Playgroud)

python arrays struct apache-spark pyspark

1
推荐指数
1
解决办法
6769
查看次数

标签 统计

apache-spark ×1

arrays ×1

pyspark ×1

python ×1

struct ×1