Lucene - 很少或很多索引

mae*_*bow 3 lucene solr elasticsearch

使用起来更好吗?

  • 在Lucene中有很多索引(例如,对于每个用户,因为你的应用程序允许这样做)
  • 或者只是一个,将每个文档都放在int中

......如果你想一想:

  • 性能
  • 磁盘空间
  • 健康

我正在使用elasticsearch,因此我使用的是Lucene.

And*_*ndy 5

在弹性搜索中,我认为根据您的信息我将使用1索引.我的理解是用户只搜索自己的文件,而且文件似乎比较相似.

性能 - 搜索时,您可以使用" 筛选查询"筛选与用户匹配的文档.用户ID过滤器可以缓存,而且速度快.

可伸缩 - 在Elasticsearch中,您可以在索引级别控制分片和复制.Elasticsearch可以处理大量索引,我只是认为配置适当的分片和复制可能对整个索引很有价值.

在单个索引中,您仍然可以轻松擦除数据(请参阅按查询删除),除非您查询错误,否则应该很少关注查看其他数据.使用该过滤器的过滤查询只会导致与用户ID相关联的查询非常简单.类似于每个用户搜索不同索引的复杂性.

您的确切需求可能更适合不同的方法.根据我到目前为止,我会选择一个索引.