Yuh*_*hao 6 java lucene search
我在Lucene的Similarity类public float idf(Term term, Searcher searcher)方法javadoc 上找到了这个:
请注意,使用Searcher.maxDoc()代替IndexReader#numDocs(),因为还使用了Searcher.docFreq(Term),当后者不准确时,Searcher.maxDoc()也是如此,并且方向相同.此外,Searcher.maxDoc()的计算效率更高.
这对我来说没有多大意义.这是否与IndexReader中的文档删除有关?
是的,完全正确.每当文档被删除(或更新,因为Lucene中的更新只是一个删除后跟一个添加),文档将保留在索引中,直到这些段被合并,通常是通过索引优化.搜索已被删除,但它的条款仍将对idf评分产生影响.
该LuceneFAQ有与此相关的,尤其是在最后一段的一些信息这个答案上删除,并明确该寻址maxDoc
| 归档时间: |
|
| 查看次数: |
1736 次 |
| 最近记录: |