Cassandra - 硬件规划

eth*_*nny 6 cassandra

简而言之:如果我有 5 Tb 的数据并想将它部署在 5 台 cassandra 服务器上 - 每台机器是否需要有 5 Tb 的数据磁盘空间(不包括日志空间)?从文档来看,有时 cassandra 需要 2 倍的数据大小 - 所以阵列中需要 10Tb/服务器或 10Tb 吗?

每台机器应该有多少内存?假设 5Tb 都在同一个列空间中。我一直计划最大化每台机器上的 RAM,但我不确定这是否足够。我是否需要一组总内存为 5Tb 的服务器?

jfg*_*956 6

如果您将 5 TB 数据均匀分布在 5 台服务器上,则每台服务器将托管 1 TB 数据。由于压缩需要,每个服务器将需要 2 TB 的磁盘空间(在最坏的情况下,压缩需要的磁盘空间是数据的两倍),这意味着集群中总共需要 10 TB。

在上述情况下,您仅在集群中存储数据的单个副本。在这种情况下,如果服务器出现故障,五分之一的数据将无法访问。如果要在集群中存储 2 个数据副本,每个节点将需要 4 TB 的磁盘空间,这意味着集群中总共需要 20 TB。