Google如何识别没有空格的2个单词?

Joh*_*ohn 6 algorithm search nlp

我想了解谷歌如何处理2个单词之间的空格.例如,有2个单词 - word1和word2.我在搜索框'word1word2'中写道,它表示你的意思是'word1 word2'或者只是理解为'word1 word2'.他们使用什么数据结构和算法的任何信息?我在这个答案中看到如何将没有空格的文本拆分成单词列表?,建议使用trie数据结构.

Chr*_*ing 5

在拼写校正器的候选生成中,您允许省略一个空格,就像您允许省略其他字母一样......也许看看这里的拼写更正讲座:http : //nlp-class.org/ [抱歉,自我推销] 或 Peter Norvig 的介绍:http : //norvig.com/spell-correct.html


An-*_*oid 1

我假设你必须有一个脚本(例如使用ajax http://net.tutsplus.com/tutorials/javascript-ajax/adding-a-jquery-auto-complete-to-your-google-custom-search-engine/

基本上你查字典里的单词。空格不能是检查单词的条件,而只是一种可能性。例如,一个简单的算法(非常简单)是:“几个单词”,你检查 3 个第一个字母,什么都没有?然后你检查 4 个第一......

以下是有关谷歌搜索引擎的一些解释: https://developers.google.com/search-appliance/documentation/60/admin_searchexp/ce_improving_search

也许这里也可以提供帮助: http://tm.durusau.net/?cat =1106