Big Query 中 APPROX_COUNT_DISTINCT 的精度

IJK*_*JK7 8 google-bigquery

在 BigQuery 的文档中,它说该函数返回 COUNT(DISTINCT 表达式) 的近似结果。但是,我想知道使用 APPROX_COUNT_DISTINCT 与 COUNT(DISTINCT 表达式) 相比的结果有什么差异。我已经在文档中查找过这个问题,但没有找到答案。

小智 0

与本文相关:https://developers.google.com/analytics/blog/2022/hll

APPROX_COUNT_DISTINCT 方差可能会有所不同 - 每次使用时。

另一方面,使用 HLL+ sketch 允许您配置估计的准确度。