一个StringToken Parser,它提供Google搜索样式"你的意思是:"建议

And*_*NER 5 language-agnostic parsing nlp

寻求一种方法:

在字符串中取空格分隔的标记; 返回建议的单词


即:
谷歌搜索可以采取"fonetic wrd nterpreterr",
并在结果页面的顶部显示"你的意思是:语音词解释器"

任何C*语言或Java的解决方案都是首选.


是否有任何现有的Open Libraries执行此类功能?

或者有没有办法利用Google API来请求建议的字词?

Con*_*tin 11

Peter Norvig 在他的文章如何编写拼写校正器中讨论了如何实现类似Google的拼写检查程序.本文包含Python中的20行实现,以及C,C++,C#和Java中几个重新实现的链接.这是一段摘录:

像Google这样的工业强度法术纠正器的全部细节会比启发更令人困惑,但我认为在飞机飞行回家中,在不到一页的代码中,我可以编写一个玩具拼写校正器,达到80%或90%处理速度至少为每秒10个字的精度.

使用Norvig的代码和本文作为训练集,我得到以下结果:

>>> import spellch
>>> [spellch.correct(w) for w in 'fonetic wrd nterpreterr'.split()]
['phonetic', 'word', 'interpreters']
Run Code Online (Sandbox Code Playgroud)