ole*_*sii 12
是的,你错过了什么.数据可能不需要重复n次,其中n是节点数.您通常会将复制因子(RF)配置为低于节点数(N).
例如,RF = 3,N = 5.意味着每行将在5个节点中随机选择的3个节点(加上原始副本)重复3次.如果一个节点发生故障,则其他节点上的其他节点将有3个副本.
这在较大的群集中效果更好,例如RF = 5,N = 100.
较高的RF可提高数据冗余和读取速度,但会降低写入速度.所以有一个平衡点,如果您的RF非常高,如RF = N,您将拥有非常高的数据冗余,对节点故障的高弹性以及高读取吞吐量.另一方面,您的写入吞吐量将非常有限,因为数据需要复制到所有节点.如果在这种情况下一个节点发生故障,则写入可能会失败(取决于客户端配置),因为无法实现所需的复制因子.
是的很多。
复制的发生取决于键空间的复制因子。因此,如果复制因子为 2,则会创建两个副本。在 20 个节点的集群中,这意味着只有 3 个节点拥有一组数据,其他 17 个节点将拥有其余数据。
根据设置为聚类键的列中的数据来划分节点中的数据。因此,在簇键列中具有相同数据的一组行将被放置在单个节点中。这是为了确保一个查询只需命中一个节点即可完成查询。
| 归档时间: |
|
| 查看次数: |
5966 次 |
| 最近记录: |