假设我有30个十亿行多列,我希望能够有效地独立发现每一列的前N个最频繁的值,并用最优雅的SQL可能.例如,如果我有
FirstName LastName FavoriteAnimal FavoriteBook
--------- -------- -------------- ------------
Ferris Freemont Possum Ubik
Nancy Freemont Lemur Housekeeping
Nancy Drew Penguin Ubik
Bill Ribbits Lemur Dhalgren
Run Code Online (Sandbox Code Playgroud)
我想要top-1,那么结果将是:
FirstName LastName FavoriteAnimal FavoriteBook
--------- -------- -------------- ------------
Nancy Freemont Lemur Ubik
Run Code Online (Sandbox Code Playgroud)
我大概可以想办法做到这一点,但不知道他们是否是最优的,当有30个十亿行这是很重要的; SQL可能很大而且很丑,可能会使用太多的临时空间.
使用Oracle.
有没有一种简单的直接方法来计算谷歌表格中的均方根/二次均值?我宁愿不必创建另一个包含第一个平方的数组来对平方求和。