719*_*016 4 sql google-bigquery
bigQuery ANY_VALUE 是确定性的吗?我有一个查询,生成约 200,000 行结果,但如果我在查询后过滤掉重复的条目,它们会减少到约 500 行。为了解决查询本身的问题,我添加了一个 GROUP BY,然后用 `ANY_VALUE(tN.fieldX) 将所有属性包装为 tN_fieldX 。输出经过排序、保存为 .csv 并执行多次后,将返回相同的 md5sum 结果文件。
这是否意味着 ANY_VALUE 正在解决我的重复条目问题,因为由于 bigQuery 中的不确定性,它每次都会给出不同的值?
显然,ANY_VALUE 是不确定的 - 但如果您针对 GROUP'ed BY 值应用该函数 - 它在某种意义上变得确定性,因为它从一组相同的值中随机选取值。所以,是的-它有助于解决像你这样的情况下的重复问题
| 归档时间: |
|
| 查看次数: |
3864 次 |
| 最近记录: |