如何根据另一列的聚合获得一列对应的值?

Tho*_*ott 6 sql greatest-n-per-group maxby snowflake-cloud-data-platform

我正在将一些 PostgreSQL 查询迁移到 Snowflake,并且正在努力复制以下查询:

WITH test_table(col1, col2, col3, col4) AS (
    VALUES 
        (1, 1, 7, 5),
        (1, 1, 6, 4),
        (1, 2, 1, 4),
        (1, 2, 2, 5),
        (1, 2, 3, 6)
)

SELECT
    col1,
    col2,
    (max(ARRAY[col3, col4]))[2]
FROM test_table
GROUP BY 1, 2
Run Code Online (Sandbox Code Playgroud)

col4此查询设法获取与 的最大值相对应的值col3 grouped by col1, col2。然而,我没有找到任何优雅的解决方案来在 Snowflake 上复制这一点。

Fel*_*ffa 4

您可以按任何顺序聚合数组。因此,您可以col3按以下顺序分组col4

with test_table(col1, col2, col3, col4) 
as (
    select * from (values 
        (1, 1, 20, 1), -- added 
        (1, 1, 7, 5),
        (1, 1, 6, 4),
        (1, 2, 1, 4),
        (1, 2, 2, 5),
        (1, 2, 3, 6))
)

SELECT
    col1,
    col2,
    array_agg(col4) within group(order by col3 desc) c4_by_max_c3
FROM test_table
GROUP BY 1, 2
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

您可以使用以下命令选择顶部数字,而不是获取此数组[0]

SELECT
    col1,
    col2,
    array_agg(col4) within group(order by col3 desc)[0] c4_by_max_c3
FROM test_table
GROUP BY 1, 2
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

希望 Snowflakemax_by将来也能支持,但尚未实现。同时这会起作用。


2023 更新:支持 MAX_BY()

https://docs.snowflake.com/en/sql-reference/functions/min_by.html

  • Snowflake 现在支持 MAX_BY (2认同)