Tho*_*ott 6 sql greatest-n-per-group maxby snowflake-cloud-data-platform
我正在将一些 PostgreSQL 查询迁移到 Snowflake,并且正在努力复制以下查询:
WITH test_table(col1, col2, col3, col4) AS (
VALUES
(1, 1, 7, 5),
(1, 1, 6, 4),
(1, 2, 1, 4),
(1, 2, 2, 5),
(1, 2, 3, 6)
)
SELECT
col1,
col2,
(max(ARRAY[col3, col4]))[2]
FROM test_table
GROUP BY 1, 2
Run Code Online (Sandbox Code Playgroud)
col4此查询设法获取与 的最大值相对应的值col3 grouped by col1, col2。然而,我没有找到任何优雅的解决方案来在 Snowflake 上复制这一点。
您可以按任何顺序聚合数组。因此,您可以col3按以下顺序分组col4:
with test_table(col1, col2, col3, col4)
as (
select * from (values
(1, 1, 20, 1), -- added
(1, 1, 7, 5),
(1, 1, 6, 4),
(1, 2, 1, 4),
(1, 2, 2, 5),
(1, 2, 3, 6))
)
SELECT
col1,
col2,
array_agg(col4) within group(order by col3 desc) c4_by_max_c3
FROM test_table
GROUP BY 1, 2
Run Code Online (Sandbox Code Playgroud)
您可以使用以下命令选择顶部数字,而不是获取此数组[0]:
SELECT
col1,
col2,
array_agg(col4) within group(order by col3 desc)[0] c4_by_max_c3
FROM test_table
GROUP BY 1, 2
Run Code Online (Sandbox Code Playgroud)
希望 Snowflakemax_by将来也能支持,但尚未实现。同时这会起作用。
https://docs.snowflake.com/en/sql-reference/functions/min_by.html