Cassandra CQL中的聚合查询

use*_*748 12 cql cassandra

我们目前正在评估Cassandra作为分析应用程序的数据存储.计划是在Cassandra中转储原始数据,然后主要运行聚合查询.看看CQL,它似乎不支持一些传统的SQL运算符,如:

  • 典型的聚合函数,如average,sum,count-Distinct等.
  • 拥有Groupby的运营商

我没有找到任何可以帮助实现上述文档的内容.还检查是否有任何钩子提供扩展等功能.比如在Mongodb中的数据库map-reduce或关系数据库中的用户定义函数.

人们确实谈到付费的Datastax企业版,这也不是通过简单的Cassandra实现的,而是通过Hadoop-Hive-Pig-Hadoop等单独的组件实现.或者有关于在将数据转储到数据库之前进行所需的预聚合的建议因为卡桑德拉的写作很快.

它看起来像是太多的开销,至少对于我们需要的基本东西.我错过了一些基本的东西吗?

非常感谢对此的帮助.

mik*_*kea 3

聚合作为2.2.0-rc1 版本中提供的CASSANDRA-4914的一部分在 cassandra 中提供。