小编Gar_hl 的帖子

大规模数据处理Hbase vs Cassandra

在研究了大规模数据存储解决方案之后,我几乎落在了卡桑德拉.但它普遍认为Hbase是大规模数据处理和分析的更好解决方案.

虽然两者都是相同的键/值存储,并且两者都是/可以运行(最近的Cassandra)Hadoop层,但是当大数据需要处理/分析时,Hadoop是更好的候选者.

我也在http://ria101.wordpress.com/2010/02/24/hbase-vs-cassandra-why-we-moved/找到了关于这两方面的详细信息.

但我仍然在寻找Hbase的具体优势.

虽然我更加信服Cassandra,因为它简单易用,无需添加节点和无缝复制,也没有故障点功能.它还保留了二级索引功能,因此它是一个很好的优点.

hadoop hbase data-processing cassandra nosql

83
推荐指数

3
解决办法

4万
查看次数

cassandra节点限制

我正在寻找cassandra是否有节点硬件规范的限制,如果有任何这样的限制,可能是每个节点的最大存储量.

我打算每个节点使用几个节点和48TB存储(2TB X 24硬盘7200rpm)和一些好的双xeon处理器.

如果存在任何但是没有找到关于这个问题的任何材料,我已经查找了这些限制.而且为什么最近关于cassandra的内容越来越少,而它已经成熟并且上升了0.8版,而大多数文章/博客只与0.6v相关.

storage cassandra

11
推荐指数

4
解决办法

7059
查看次数

mysql集群赶上cassandra？

我最近一直在为我们即将推出的相当大的数据库寻找nosql解决方案,并发现cassandra很好,但网上有关cassandra新版本的资源非常少,而且大多数博客和文章与0.6版本有关,而现在它也有实施了对hadoop和hive的支持.另一方面,mysql集群版本也专门用于使用商用服务器在水平扩展设置上运行.

由于我们已经习惯了关系模型多年并且转向cassandra需要反编译大脑,而产品仍然不是很成熟,社区也不是那么大,以便快速响应我检查过的任何特定问题datastax(在专业支持上)提供者)网站及其论坛已经死了.

那么,如何比较mysql cluster vs cassandra,同时将关系和非关系比较放在一边？

尽管cassandra的架构较少,但它仍然提供了很多表格特征,如超级列和子列,因此可以从多个列值中搜索记录.

我也尽力了解cassandra如何实际存储更新的查询,例如在编辑子列时添加一行,然后添加相当大的数据块,然后如何实际存储该记录以及如何快速访问该记录？因为在mysql列中分配了固定长度所以它不是一个大问题.

mysql cluster-computing cassandra

6
推荐指数

3
解决办法

3382
查看次数

cassandra复制或突袭

对于传统的RDBMS,我们在大多数情况下习惯使用RAID10,但如果使用cassandra RF = 2,那么我们确实只有一个副本作为备份,那么在这种情况下为什么不使用RAID10或为什么使用RAID10.

我认为这将减少cassandra复制的开销.

此外,在RAID10中,如果硬盘驱动器出现故障,那么整个节点将继续工作,但如果使用复制,则一个硬盘驱动器故障会导致整个节点出现故障？

虽然我认为使用RAID10会在每次写入时产生开销,但是当SSTABLE已满时会进行刷新,因此不会一直感觉到它.

6
推荐指数

1
解决办法

1110
查看次数

标签统计

cluster-computing ×1

data-processing ×1

raid ×1