保持索引实时的最佳方法?

Ahs*_*bal 15 lucene optimization solr

我有一个大约700 Gb的Solr/Lucene索引文件.我需要索引的文档是实时读取的,每30分钟提交大约1000个文档,需要编制索引.在我的场景中,脚本每30分钟运行一次,索引尚未编制索引的文档,因为要求新文档尽快可以搜索,但这个过程会减慢搜索速度.

这是我索引最新文档的最佳方式,还是有其他更好的方法!

Pas*_*imo 10

首先,请记住Solr不是一个实时搜索引擎(尚未).仍有工作要做.

您可以使用主/从设置,其中索引在主设备上完成,搜索在从设备上.有了这个,索引不会影响搜索性能.在主服务器上完成提交后,强制从服务器从主服务器获取最新的索引.在从属服务器上复制新索引时,它仍然使用先前的索引处理查询.

另外,检查缓存加温设置.请记住,如果这些设置过于激进,这可能会降低搜索速度.还要检查在新搜索器事件上启动的查询.