use*_*770 5 google-bigquery
有没有办法事先弄清楚(不是通过反复试验)特定查询是否应该使用GROUP BY或GROUP EACH BY?我们目前看到,在基数为~60-70%后,我们被要求使用EACH集团.我们生成SQL时很难预测.
Fel*_*ffa 5
"EACH"的使用不依赖于查询,而是依赖于数据.组表达式是否有少量唯一值?使用GROUP BY.有很多吗?使用GROUP EACH BY.
最好的策略是使用GROUP BY,直到出现"超限错误".
为了更深入地了解"为什么?",你可以看看开始这一切的Dremel论文.基本上GROUP BY在混音器中运行,而GROUP EACH BY则被推送到分片.
有关其他见解,请在查询执行期间检查资源超出时的 jcondit的答案.
归档时间:
12 年,6 月 前
查看次数:
2252 次
最近记录:
10 年,9 月 前