小编sno*_*ser的帖子

在合并语句中使用哈希键作为比较列

我必须在雪花数据库中实现合并语句。Target 表中将有超过 60 亿行。比较起来有 20 多个列。我想HASH在 Snowflake 中的所有 20 列的基础上使用函数生成哈希键。但我阅读了文档哈希,其中提到在 40 亿行之后,可能会获得重复的哈希键。我的理解正确吗?那么我应该避免使用哈希键来比较记录并使用所有列吗?或者可以使用md5hexa 128 位或任何定制的哈希函数。请建议。

在此输入图像描述

hash snowflake-cloud-data-platform

3
推荐指数
1
解决办法
2637
查看次数