CAP与分布式系统

Question

当我们谈论nosql分布式数据库系统时,我们知道所有这些都属于CAP theoram的三分之二.对于分布式集群,网络故障和节点故障是不可避免的,因此分区容差是必需的,因此我们从可用性和一致性中选择一个.所以它基本上是CP或AP.

我的问题是

提前致谢 :)

Answer 1

HDFS有一个独特的中心决策点,即namenode.因此它只能落在CP端,因为取下namenode会占用整个HDFS系统(无可用性).Hadoop不会试图隐藏这个:

NameNode是HDFS群集的单点故障.HDFS目前不是高可用性系统.NameNode关闭时,文件系统将脱机.有一个可选的SecondaryNameNode,可以托管在单独的计算机上.它仅通过将编辑文件合并到fsimage文件中来创建命名空间的检查点,并且不提供任何实际冗余.

由于decipeion放置数据的位置和可以读取的位置总是由namenode处理,它在内存中保持一致的视图,HDFS始终是一致的(C).它也是分区容忍的,因为它可以处理丢失的数据节点,受复制因素和数据拓扑策略的限制.

有没有可以提供CAP的系统？

是的,市场营销和其他非技术出版物中经常提到这样的系统.

用户何时选择可用性而不是一致性,反之亦然.

这是一个商业用例决定.当可用性更重要时,他们选择AP.当一致性更重要时,他们选择CP.通常,当钱转手时,一致性优先.几乎所有其他案例都倾向于可用性.

是否有任何数据库允许用户在CP和AP之间相应地切换其选择

允许您修改写入和读取仲裁的系统可以根据需要调整为CP或AP.