相关疑难解决方法(0)

连接Apache Spark DataFrame中的列

我们如何在Apache Spark DataFrame中连接两列？我们可以使用Spark SQL中的任何函数吗？

sql dataframe apache-spark apache-spark-sql

Nip*_*pun

2018 06-17

95
推荐指数

8
解决办法

20万
查看次数

spark：如何将行合并到jsons数组

输入：

id1   id2    name   value           epid
"xxx" "yyy"  "EAN"  "5057723043"    "1299"
"xxx" "yyy"  "MPN"  "EVBD"          "1299"

Run Code Online (Sandbox Code Playgroud)

我想要：

{         "id1": "xxx",
          "id2": "yyy",
          "item_specifics": [
            {
              "name": "EAN",
              "value": "5057723043"
            },
            {
              "name": "MPN",
              "value": "EVBD"
            },
            {
              "name": "EPID",
              "value": "1299"
            }
          ]
}

Run Code Online (Sandbox Code Playgroud)

我从如何将列聚合到json数组中尝试了以下两种解决方案？以及如何将行合并为spark数据框的列作为有效json以将其写入mysql中：

pi_df.groupBy(col("id1"), col("id2"))
  //.agg(collect_list(to_json(struct(col("name"), col("value"))).alias("item_specifics"))) // => not working
  .agg(collect_list(struct(col("name"),col("value"))).alias("item_specifics"))

Run Code Online (Sandbox Code Playgroud)

但是我得到了：

{ "name":"EAN","value":"5057723043", "EPID": "1299", "id1": "xxx", "id2": "yyy" }

Run Code Online (Sandbox Code Playgroud)

如何解决这个问题？谢谢

scala apache-spark apache-spark-sql

BAE*_*BAE

2019 03-01

0
推荐指数

1
解决办法

574
查看次数

标签统计

apache-spark ×2

apache-spark-sql ×2

dataframe ×1

scala ×1

sql ×1

连接Apache Spark DataFrame中的列

spark：如何将行合并到jsons数组

标签 统计

标签统计