你考虑过fuzzystrmatch模块吗?您可以使用soundex,difference,levenshtein,metaphone和dmetaphone,或它们的组合.
SELECT something
FROM somewhere
WHERE levenshtein(item1, item2) < Carefully_Selected_Threshold
Run Code Online (Sandbox Code Playgroud)
例如,从MICROSOFT到MICROSFT的levenshtein距离是一(1).
levenshtein(dmetaphone('MICROSOFT'), dmetaphone('MICROSFT')
Run Code Online (Sandbox Code Playgroud)
以上返回零(0).结合levenshtein和dmetaphone可以帮助你匹配许多拼写错误.
| 归档时间: |
|
| 查看次数: |
1032 次 |
| 最近记录: |