我是Solr的新手.通过阅读Solr的wiki,我不明白WhitespaceTokenizerFactory和StandardTokenizerFactory之间的区别.他们真正的区别是什么?
csu*_*nig 26
他们将分析的文本分成标记的方式不同.
该StandardTokenizer这是否基于以下(从Lucene的javadoc中获取):
该WhitespaceTokenizer做此基础上的空白字符:
WhitespaceTokenizer是一个在空白处划分文本的标记化器.相邻的非空白字符序列形成令牌.
您应该选择最适合您的应用程序的标记器.在任何情况下,您都必须使用相同的分析器/标记器进行索引和搜索!