dha*_*har 2 arrays json presto amazon-athena trino
我的数据是 varchar 格式。我想拆分这个数组的两个元素,以便我可以从 json 中提取一个键值。
Data format:
[
{
"skuId": "5bc87ae20d298a283c297ca1",
"unitPrice": 0,
"id": "5bc87ae20d298a283c297ca1",
"quantity": "1"
},
{
"skuId": "182784738484wefhdchs4848",
"unitPrice": 50,
"id": "5bc87ae20d298a283c297ca1",
"quantity": "4"
},
]
Run Code Online (Sandbox Code Playgroud)
例如,我想从上列中提取 skuid。所以我提取后的数据应该是这样的:
1 5bc87ae20d298a283c297ca1
2 182784738484wefhdchs4848
Run Code Online (Sandbox Code Playgroud)
强制转换为数组不起作用,例如 select cast(col as array) 给出以下错误:Unknown type: array
所以我无法取消嵌套数组。
我如何在 Athena 中解决这个问题?
您可以结合使用将值解析为 JSON、将其转换为结构化 SQL 类型(数组/映射/行)和UNNEST WITH ORDINALITY以将元素从数组中提取为单独的行。请注意,这仅在 JSON 有效负载中的数组元素没有尾随逗号时才有效。您的示例有一个,但已从下面的示例中删除。
WITH data(value) AS (VALUES
'[
{
"skuId": "5bc87ae20d298a283c297ca1",
"unitPrice": 0,
"id": "5bc87ae20d298a283c297ca1",
"quantity": "1"
},
{
"skuId": "182784738484wefhdchs4848",
"unitPrice": 50,
"id": "5bc87ae20d298a283c297ca1",
"quantity": "4"
}
]'
),
parsed(entries) AS (
SELECT cast(json_parse(value) AS array(row(skuId varchar)))
FROM data
)
SELECT ordinal, skuId
FROM parsed, UNNEST(entries) WITH ORDINALITY t(skuId, ordinal)
Run Code Online (Sandbox Code Playgroud)
产生:
ordinal | skuId
---------+--------------------------
1 | 5bc87ae20d298a283c297ca1
2 | 182784738484wefhdchs4848
(2 rows)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
11140 次 |
| 最近记录: |