我想知道如何在SolrCloud之上设置负载均衡器或者不需要负载均衡器?
如果是前者,需要将碎片领导者添加到负载均衡器中?那么如果碎片领导者出于某种原因而改变呢?或者,群集中的所有计算机(包括副本)都可以更好地添加到负载均衡器中?
如果是后者,我猜一个cname需要指向SolrCloud集群,它应该是循环DNS吗?
来自一些实际的Solrcloud操作经验的任何建议都会非常有用.
通常SolrCloud与ZooKeeper结合使用,客户端使用CloudSolrServer访问SolrCloud.
查询将在以下流程中完成.
请注意,我只是部分阅读了Solr的源代码,并且有很多猜测.我读到的也是Solr 4.1的源代码,所以它可能已经过时了.
IPAddress:Port所有SolrCloud服务器的列表.CloudSolrServer从ZooKeeper检索服务器列表的实例.CloudSolrServer 随机选择一个SolrCloud服务器并向其发送查询.(也是 LBHttpSolrServer在循环中选择服务器?)更新将以与上述相同的方式完成,但也将填充到所有服务器.
请注意,对于SolrCloud,领导者和副本的差异很小,我们可以向任何服务器发送查询/更新.它会自动重定向到其他服务器.
简而言之,负载均衡在客户端和服务器端完成.所以你不必担心它.