小编Sco_Chu的帖子

SolrCloud上的自定义分片或自动分片？

我想为超过一千万条新闻文章建立一个SolrCloud clsuter.阅读本文后:SolrCloud中的碎片和索引数据,我的计划如下:

添加前缀ED2001!记录ID,其中ED表示某些报纸来源,2001年是新闻文章发布日期的年份部分,即我想将特定年份发布的特定新闻纸源的所有新闻文章放入碎片.
使用router.name设置为compositeID创建集合.
添加文件？
查询集合？

实际上,我有一些问题:

如何根据此计划添加doucments？更新集合/核心时是否必须指定特殊参数？
这被称为"自定义分片"吗？如果没有,什么是"自定义分片"？
对于我的情况,自动分片是一个更好的选择,因为当分片太大时,自动分片有一个分片分割功能吗？
我可以在没有_router_参数的情况下查询吗？

编辑@ 2015/9/2:

这就是我认为SolrCloud会做的事情:"特定年份特定报纸来源的新闻文章数量往往在一个固定数字附近,例如,每年ED有大约80,000篇文章,因此每个碎片的大小不会大幅增加.在明年ED的新闻文章中,我只需添加前缀'ED2016!' 为了记录ID,SolrCloud将为我创建一个新的分片(其中包含所有ED2016文章),之后领导者会将这个新分片的副本传播到其他节点(每个节点除了领导者以外每个副本？)".我对吗？如果是的话,似乎不需要分裂碎片.

routing solr sharding solrcloud

2
推荐指数

1
解决办法

2379
查看次数

标签统计

solr ×1