6 bigdata cassandra nosql cassandra-cli
我是Cassandra的新手,我想知道Cassandra RACKS.我也对Cassandra结构感到困惑.假设我在Cassandra中拥有AROUND 70列族和两个AWS2实例.
1.how many Data Center will be used.
2.how many nodes each rack will have ?
3.is it possible to divide column family in multiple Key space.
Run Code Online (Sandbox Code Playgroud)
让Cassandra了解逻辑机架和数据中心的目的是提供额外的容错级别.这个想法(如本文档 "网络拓扑策略"中所述)是,如果一个机架或数据中心变暗,应用程序仍然可以运行.基本上,卡桑德拉......
通过顺时针走环,直到到达另一个机架中的第一个节点,将复制品放在同一个数据中心.NetworkTopologyStrategy尝试将副本放置在不同的机架上,因为同一机架(或类似的物理分组)中的节点通常由于电源,冷却或网络问题而同时发生故障.
通过这种方式,您还可以通过LOCAL_QUORUM查询数据,其中QUORUM((replication_factor/2)+ 1)仅从与协调器节点位于同一数据中心的节点计算.这减少了数据中心间延迟的影响.
至于你的问题:
使用了多少个数据中心完全取决于您.如果您只有两个AWS实例,则可以将它们放在不同的逻辑数据中心,但只有在计划使用一致性级别1时才有意义.如果一个实例出现故障,您的应用程序只需要担心找到另一个副本.但即便如此,金色飞贼只能在一个实例或另一个实例上找到数据.
同样,您可以定义每个机架所需的节点数.但正如我在#1中指出的那样,如果你只有两个实例,那么将它们分成不同的数据中心或机架并没有多少好处.
我不相信可以在多个键空间上划分列族.但我想我知道你在做什么.将在每个实例上创建每个键空间.由于您有2个实例,因此您可以指定复制因子1或2.如果您有3个实例,则可以将复制因子设置为2,然后如果丢失1个实例,您仍然可以访问所有实例数据.由于您只有2个实例,因此您需要能够处理一个黑暗的实例,因此您需要确保两个实例都具有每行的副本(复制因子为2).
实际上,随着群集中节点数量的增加,逻辑数据中心/机架结构变得更加有用.只有两个,通过额外的逻辑障碍将它们分开,几乎没有什么可以获得的.有关更多信息,请仔细阅读上面链接的两个文档:
| 归档时间: |
|
| 查看次数: |
5607 次 |
| 最近记录: |