SnowFlake 中的模糊匹配,如 EDIT_DISTANCE_SIMILARITY

Ars*_*jid 3 snowflake-cloud-data-platform

我们是否有任何用于名称模糊匹配的函数,就像oracle中的UTL_MATCHING.EDIT_DISTANCE_SIMILARITY一样。我必须找到行级别的差异。

Gre*_*lik 5

Snowflake 具有 EDITDISTANCE 和 SOUNDEX 函数:

select editdistance('Duningham', 'Cunningham');
-- Result 2

select soundex('McArthur') = soundex('MacArthur');
-- Result TRUE
Run Code Online (Sandbox Code Playgroud)

对于 EDITDISTANCE,与 EDIT_DISTANCE_SIMILARITY 不同,较低的分数表示更接近的匹配。有许多模糊匹配的开源 JavaScript 实现,您可以将其插入 Snowflake JavaScript UDF 中。