我必须在雪花数据库中实现合并语句。Target 表中将有超过 60 亿行。比较起来有 20 多个列。我想HASH在 Snowflake 中的所有 20 列的基础上使用函数生成哈希键。但我阅读了文档哈希,其中提到在 40 亿行之后,可能会获得重复的哈希键。我的理解正确吗?那么我应该避免使用哈希键来比较记录并使用所有列吗?或者可以使用md5hexa 128 位或任何定制的哈希函数。请建议。
HASH
md5
hash snowflake-cloud-data-platform
hash ×1
snowflake-cloud-data-platform ×1