小编Mik*_*rev的帖子

zend lucene"抵押"一词的问题

我正在使用Porter Stemmer来阻止这些话,这是我遇到的一个问题:

单词"抵押"被正确地归结为"抵押"字"抵押权人"(可以说是错误地)被称为"抵押"

有大约100个文件,其中包含"抵押贷款"这个词有1个文件,内容只有"抵押贷款"

当我在没有将"抵押权人"放入任何文件的情况下建立索引时,一切正常:搜索"抵押"或"抵押"或"抵押"会返回所有100份文件.

当我建立一个索引并且其中一个文件包含"抵押权人"时,在索引中搜索"抵押贷款"只会返回一个带有"抵押权人"的单一文件(这被归结为"抵押").但是,搜索"抵押"或"抵押"会返回所有100份文件.

我可以从这个问题得出的唯一合乎逻辑的结论是lucene首先搜索预先词干,如果没有找到任何结果,它继续搜索词干.因此,当搜索"抵押贷款"时,它首先发现源自"抵押权人"的"抵押贷款"并停止搜索.这是正确的行为,还是一个错误?

php lucene zend-search-lucene

9
推荐指数
1
解决办法
462
查看次数

标签 统计

lucene ×1

php ×1

zend-search-lucene ×1