我想听听您对使用CQL和内存查询引擎Spark/Shark的想法和经验.据我所知,CQL处理器在每个节点上的Cassandra JVM中运行.与Cassandra集群连接的Shark/Spark查询处理器在一个独立的集群中运行.此外,Datastax拥有Cassandra的DSE版本,允许部署Hadoop/Hive.问题是在哪个用例中我们会选择一个特定的解决方案而不是另一个.
hive cql cassandra apache-spark shark-sql
apache-spark ×1
cassandra ×1
cql ×1
hive ×1
shark-sql ×1