索引时Solr变慢

Arj*_*jit 7 performance solr spell-checking

我有超过100个CSV文件,其中有10000行,我正在编制索引.然后查询拼写是类似的拼写.虽然做这个索引非常慢.

我找到了一些很好的解决方案

  1. 主从索引和从属用于查询的主从属.如何更快地索引Solr中的记录(而不是影响ColdFusion Web服务器)?两个JVM?

  2. 使用Tri-Range http://www.lucidimagination.com/blog/2009/05/13/exploring-lucene-and-solrs-trierange-capabilities/

我知道这两种解决方案不同我想要一些应该优先考虑的评论吗?第二种解决方案是否适合我的问题?如果我的拼写检查问题有更多的解决方案.

提前致谢

Wal*_*ood 8

索引通常会使查询变慢.如果你有快速磁盘,索引将使用100%的CPU,否则,它将使用100%的磁盘带宽.无论哪种方式,查询都会很慢.

主/从配置是此的标准解决方案.从属服务器专用于搜索查询.他们减速的唯一时间是在复制之后,当创建具有新缓存的新搜索者时.

主/从配置可能不会使索引更快,但它将避免慢查询性能.已经有关于对多线程建立索引的工作,因此您可能希望一次测试多个索引任务.如果瓶颈是磁盘IO,那么这将无济于事,只有当它使用100%的一个CPU时.

Trie字段非常适合范围查询.我怀疑它们对索引速度有多大影响.

最后,您可能想要调整拼写建议选项.拼写建议可以做很多工作,你可以用不同的,更便宜的选项获得好的结果.