Hbase vs Cassandra:对于时间序列数据存储哪个更好?

Mou*_*una 6 analytics hadoop hbase bigdata cassandra

我使用我的API日志来提取如下信息:

  • 在这段时间里,我的API用户有多少?
  • 或者在这段时间内,什么类型的服务被称为最多?

我提取的几乎所有信息都取决于时间戳.实际上我使用MongoDB并添加了时间戳作为索引(对于80GB,索引大小为12GB).

我建议迁移到cassandra或Hbase.我想知道哪个更好用于我的用例:

  • 分析时间序列数据.
  • 要求良好的写入和读取性能.
  • 使用hadoop进行数据分析的可能性.

感谢您分享您的观点或经验.

mil*_*wey 5

Cassandra的优点:Cassandra通常表现出更好的性能(尽管两者都很出色).从操作的角度来看,Cassandra更容易设置和管理(尽管有一些工具可以帮助这两种方式).

HBase的优点:原生于hadoop生态系统

HBase无论如何都会要求你安装hadoop,你会得到一个很好的二合一.要使用Cassandra,您可能需要使用DataStax Enterprise,这是一种商业非开源产品,或者使用Spark进行分析工作,该分析工作具有Cassandra的开源连接器.

  • 我们将Apache Spark与Apache Cassandra(没有DataStax Enterprise)一起使用.虽然我不得不为自动化编写一些初始脚本,但实现目标非常简单.DSE提供Hadoop/Solr/Spark /等集成OOB,而您需要为apache版本编写自己需要的脚本.如果您正在寻找的是时间序列分析+查询,那么Spark + Cassandra将胜任这项工作,而不需要您设置Hadoop. (3认同)

小智 -1

巧克力冰淇淋和香草冰淇淋——哪个更好?

我建议你是最好的决策者。为每个选项设置开发环境,这将告诉您更多有关操作和调整问题的信息,我认为,其他人可能无法为您提供更多信息。:)