如何从直方图中选择最高值对应的键?

Ale*_*x R 2 amazon-athena

我正在使用histogram()函数https://prestodb.github.io/docs/current/functions/aggregate.html

它“返回一个包含每个输入值出现次数计数的映射。”

结果可能如下所示:

{ORANGES=1, APPLES=165, BANANAS=1}
Run Code Online (Sandbox Code Playgroud)

是否有一个函数会APPLES根据上述输入返回?

XY问题?

精明的读者可能会注意到histogram()结合我正在尝试做的最终结果,将等同于神话般的Mode Function,它存在于教科书中但不存在于现实世界的数据库引擎中。

这是我此时的完整查询。我正在upper(cmplx)为每个upper(address),zip元组寻找最常出现的值:

select * from (select upper(address) as address, zip, 
               (SELECT max_by(key, value) 
                FROM unnest(histogram(upper(cmplx))) as t(key, value)),
               count(*) as N
from apartments 
group by upper(address), zip) t1
where N > 3
order by N desc;
Run Code Online (Sandbox Code Playgroud)

和错误...

SYNTAX_ERROR:第 2:55 行:常量表达式不能包含列引用

小智 5

这是我用来从任意映射中获取对应于最大值的键的方法:

MAP_KEYS(mapname)[
                ARRAY_POSITION(
                    MAP_VALUES(mapname),
                    ARRAY_MAX(MAP_VALUES(mapname))
                )
            ]
Run Code Online (Sandbox Code Playgroud)

将您的直方图替换为“mapname”。

不确定这个解决方案在计算上如何与其他答案进行比较,但我确实发现它更容易阅读。