我正在使用histogram()函数https://prestodb.github.io/docs/current/functions/aggregate.html
它“返回一个包含每个输入值出现次数计数的映射。”
结果可能如下所示:
{ORANGES=1, APPLES=165, BANANAS=1}
是否有一个函数会APPLES根据上述输入返回?
XY问题?
精明的读者可能会注意到histogram()结合我正在尝试做的最终结果,将等同于神话般的Mode Function,它存在于教科书中但不存在于现实世界的数据库引擎中。
这是我此时的完整查询。我正在upper(cmplx)为每个upper(address),zip元组寻找最常出现的值:
select * from (select upper(address) as address, zip, 
               (SELECT max_by(key, value) 
                FROM unnest(histogram(upper(cmplx))) as t(key, value)),
               count(*) as N
from apartments 
group by upper(address), zip) t1
where N > 3
order by N desc;
和错误...
SYNTAX_ERROR:第 2:55 行:常量表达式不能包含列引用
小智 5
这是我用来从任意映射中获取对应于最大值的键的方法:
MAP_KEYS(mapname)[
                ARRAY_POSITION(
                    MAP_VALUES(mapname),
                    ARRAY_MAX(MAP_VALUES(mapname))
                )
            ]
将您的直方图替换为“mapname”。
不确定这个解决方案在计算上如何与其他答案进行比较,但我确实发现它更容易阅读。
| 归档时间: | 
 | 
| 查看次数: | 3145 次 | 
| 最近记录: |