小编Sco*_*Chu的帖子

SolrCloud上的自定义分片或自动分片?

我想为超过一千万条新闻文章建立一个SolrCloud clsuter.阅读本文后:SolrCloud中的碎片和索引数据,我的计划如下:

  1. 添加前缀ED2001!记录ID,其中ED表示某些报纸来源,2001年是新闻文章发布日期的年份部分,即我想将特定年份发布的特定新闻纸源的所有新闻文章放入碎片.
  2. 使用router.name设置为compositeID创建集合.
  3. 添加文件?
  4. 查询集合?

实际上,我有一些问题:

  1. 如何根据此计划添加doucments?更新集合/核心时是否必须指定特殊参数?
  2. 这被称为"自定义分片"吗?如果没有,什么是"自定义分片"?
  3. 对于我的情况,自动分片是一个更好的选择,因为当分片太大时,自动分片有一个分片分割功能吗?
  4. 我可以在没有_router_参数的情况下查询吗?

编辑@ 2015/9/2:

  1. 这就是我认为SolrCloud会做的事情:"特定年份特定报纸来源的新闻文章数量往往在一个固定数字附近,例如,每年ED有大约80,000篇文章,因此每个碎片的大小不会大幅增加.在明年ED的新闻文章中,我只需添加前缀'ED2016!' 为了记录ID,SolrCloud将为我创建一个新的分片(其中包含所有ED2016文章),之后领导者会将这个新分片的副本传播到其他节点(每个节点除了领导者以外每个副本?)".我对吗?如果是的话,似乎不需要分裂碎片.

routing solr sharding solrcloud

2
推荐指数
1
解决办法
2379
查看次数

标签 统计

routing ×1

sharding ×1

solr ×1

solrcloud ×1