小编ak1*_*k17的帖子

Spark SQL 中用逗号分隔的字符串爆炸列

我有以下数据集

+----+-----------+
|col1|       col2|
+----+-----------+
|   1|val1, val2 |
|   2|val3, val4 |
+----+-----------+
Run Code Online (Sandbox Code Playgroud)

将所有值视为字符串现在我想将其转换为下面的数据集

+----+-----------+
|col1|       col2|
+----+-----------+
|   1|val1       |
|   1|val2       |
|   2|val3       |
|   2|val4       |
+----+-----------+
Run Code Online (Sandbox Code Playgroud)

我怎样才能实现这个目标?

apache-spark apache-spark-sql

0
推荐指数
1
解决办法
6713
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1