python搜索技术:单词相似度

Bin*_*hen 3 python search search-engine similarity

我想获得两个单词的相似百分比,例如)

abcd versus zzabcdzz == 50% similarity
Run Code Online (Sandbox Code Playgroud)

不需要非常准确.有没有办法做到这一点?我正在使用python,但随时可以推荐其他语言.

Mar*_*ers 6

尝试使用python-Levenshtein计算编辑距离.

Levenshtein Python C扩展模块包含用于快速计算的函数

  • Levenshtein(编辑)距离和编辑操作
  • 字串相似
  • 近似中值字符串,通常是字符串平均值
  • 字符串序列和集相似性

您可以通过计算两个字符串之间的编辑距离除以最长字符串的长度来粗略了解相似性.在您的示例中,编辑距离为4,最大可能编辑距离为8,因此相似度为50%.