轻量级模糊搜索库

aku*_*aku 14 fuzzy-search

你能建议一些轻量级模糊文本搜索库吗?

我想要做的是允许用户使用拼写错误找到搜索字词的正确数据.

我可以使用像Lucene这样的全文搜索引擎,但我认为这是一种过度杀伤力.

编辑:
为了使问题更清楚,这里是该库的主要场景:
我有一个很大的字符串列表.我希望能够在此列表中搜索(类似于MSVS的intellisense)但是应该可以通过字符串过滤此列表,该字符串不存在于其中,但足够接近列表中的某个字符串.
例:

  • 红色
  • 绿色
  • 蓝色

当我在文本框中输入'Gren'或'Geen'时,我想在结果集中看到'Green'.

索引数据的主要语言是英语.

我认为Lucene对于这项任务非常重要.

更新:

我找到了一个符合我要求的产品.这是ShuffleText.
你知道其他选择吗?

cee*_*yoz 0

@aku - 工作 soundex 库的链接就在页面底部。

至于编辑距离,维基百科文章底部也列出了实现。