主从与分布式计算

Pra*_*ati 7 p2p hbase distributed-computing master-slave cassandra

HBase有一个主从模型,而Cassandra有一个点对点模型.我知道在主从模型中,主服务器是SPOF(单点故障),并且在对等模型中没有这样的东西.

每种型号还有其他优缺点吗?特别是我正在寻找主对手在对等模型上的任何优势.

Mat*_*ght 2

一方面是主节点不是 HBase 中的 SPOF,因为您可以进行多主配置。 http://wiki.apache.org/hadoop/Hbase/MultipleMasters

拥有大师可以更轻松地了解数据在哪里以及要去哪里。它也基于 Hadoop,因此与 Map Reduce 的集成非常好(其中 Map 作业会自然地拆分到区域服务器并为您提供一行)。我认为这是主要的优点。

Cassandra 的主要“缺点”是最终一致性模型,尽管它允许您选择一致性模型。

一个比较点是,HBase 中的数据是按键排序的,而 Cassandra 中的数据是随机的。尽管您始终可以选择 GUID 或随机密钥来模拟 Cassandra 的行为,但这可以为 HBase 中的智能密钥带来一些好处。Cassandra 可以非随机分区,但 HBase 仍然更适合范围扫描。

我都用过,它们都有效,而且都需要做很多工作才能继续工作。