SOLR指数大小减少

jay*_*100 4 memory indexing optimization solr

我们为一个大型项目提供了一些大量的SOLR指数,并且它消耗了超过50 GB的空间.

我们已经考虑了几种方法,以减少相关的改变索引内容的大小,但我很好奇阉与否有可能是一个SOLR指数将由2个数量级的减小其尺寸的任何变化,我们可以使或者更多,它们与(1)我们可以运行的维护命令或(2)可能无法正确设置的简单配置参数直接相关.

另一个相关的问题是(3)有没有办法在SOLR中交易索引大小以获得性能,如果有,它将如何工作?

对此的任何想法将不胜感激......谢谢!

Nic*_*ark 11

对于索引大小,您可以通过几种方式来交易性能.例如,整数(int)字段使用的空间小于trie整数(tint),但使用int时范围查询会更慢.

要大幅减少索引,您几乎肯定需要更仔细地查看您正在使用的字段.

  • 你使用了很多存储的字段吗?如果是这样,尝试从索引中删除存储的字段,并在从Solr获得结果后查询数据库以获取必要的数据.
  • 将omitNorms ="true"添加到不需要长度规范化的文本字段中
  • 将omitPositions ="true"添加到不需要词组匹配的文本字段中
  • 像NGrams这样的特殊领域可以占用大量空间
  • 您是否从文本字段中删除了停用词?