SOLR 1.4中现场倒塌的最佳实践

Dom*_*nik 5 solr

我需要一种方法来折叠复制(用带有id的字符串字段定义)导致solr.我知道这个功能正在下一个版本(1.5)中出现,但我不能等待.使用当前稳定版本1.4删除重复项的最佳方法是什么?

鉴于在我的情况下找到重复项非常容易(比较一个字符串字段),如果它是一个Filter,我应该覆盖现有的SearchComponent还是编写一个新的Component,还是使用像carrot2这样的外部库?

总体结果计数应反映缩短的结果.

Lic*_*ici 6

好吧,有一个解决方案:只需应用折叠字段补丁(请参阅http://issues.apache.org/jira/browse/SOLR-236以获取有关此功能的最新消息,我也建议您使用http:// blog. jteam.nl/author/martijn).

这样做可以使CollapseComponent正常工作.请注意,此功能会导致搜索性能下降.