cod*_*ark 13 lucene indexing solr cassandra solandra
我的团队让我在Cassandra和SOLR之间做出选择,以便更快地回复@ frond结束查询.我告诉他们,Cassandra是NOSQL db的东西,而SOLR是索引的东西.但后来他们说我们可以将完整的数据库推送到SOLR(就像使用SOLR作为数据库),或者我们可以使用Cassandra和SOLR.一切困惑.
我们处理的数据量大约是10亿分布在4个MySQL表(使用连接获取),我们只从网站上读取查询.我们不需要全文搜索
我认为SOLR不容易被击败的是它的全文搜索功能,但是我们在我们的情况下不需要它.
那么SOLR还有哪些Cassandra无法提供的内容以及Cassandra在特定情况下可以取代SOLR的内容呢?
换句话说,谁会表现得更好?卡桑德拉一个人?SOLR作为一个单独的数据库?或者两者在一起?最重要的是为什么以及为什么不呢?
对我来说,以强有力的观点来支持我的选择非常重要,好像为什么在我的下一次团队会议期间为什么一个比其他人好.
并提前感谢.
编辑:
如果您不需要Solr的全文搜索功能,我认为没有理由在Cassandra上选择它.
(披露:我为DataStax工作.)
在操作上,由于基于Dynamo的架构,处理Cassandra集群将更加简单.Sharding Solr可能非常痛苦,这也是我们DataStax在DSE中构建搜索的重要原因之一.这是许多人想要避免的事情.我不是想把你卖给DSE,只是指出Solr的缺点.
例如,当您想要使用Solr更改分片数时,您必须创建并构建一个全新的索引.你必须担心Solr集群的死锁.还有其他一些限制:http://wiki.apache.org/solr/DistributedSearch
您还没有多说您需要支持哪种类型的查询.添加该信息可以获得更好的答案.
小智 5
这就是“大但是”的用武之地。
最后,因为您希望 CASSANDRA 和 SOLR 在一起。查看SOLANDRA(前卢坎德拉)