我正在使用histogram()函数https://prestodb.github.io/docs/current/functions/aggregate.html
它“返回一个包含每个输入值出现次数计数的映射。”
结果可能如下所示:
{ORANGES=1, APPLES=165, BANANAS=1}
Run Code Online (Sandbox Code Playgroud)
是否有一个函数会APPLES根据上述输入返回?
XY问题?
精明的读者可能会注意到histogram()结合我正在尝试做的最终结果,将等同于神话般的Mode Function,它存在于教科书中但不存在于现实世界的数据库引擎中。
这是我此时的完整查询。我正在upper(cmplx)为每个upper(address),zip元组寻找最常出现的值:
select * from (select upper(address) as address, zip,
(SELECT max_by(key, value)
FROM unnest(histogram(upper(cmplx))) as t(key, value)),
count(*) as N
from apartments
group by upper(address), zip) t1
where N > 3
order by N desc;
Run Code Online (Sandbox Code Playgroud)
和错误...
SYNTAX_ERROR:第 2:55 行:常量表达式不能包含列引用
小智 5
这是我用来从任意映射中获取对应于最大值的键的方法:
MAP_KEYS(mapname)[
ARRAY_POSITION(
MAP_VALUES(mapname),
ARRAY_MAX(MAP_VALUES(mapname))
)
]
Run Code Online (Sandbox Code Playgroud)
将您的直方图替换为“mapname”。
不确定这个解决方案在计算上如何与其他答案进行比较,但我确实发现它更容易阅读。
| 归档时间: |
|
| 查看次数: |
3145 次 |
| 最近记录: |