SSTables压缩(主要和次要)的边界在什么时候变得无效?
如果我有500G SSTables的主要压缩,我的最终SSTable将超过1TB - 这对于一个节点"重写"这个大数据集是否有效?
这可能需要大约一天的硬盘驱动器,并需要双倍的空间,所以有这方面的最佳做法?
我试图理解Cassandra与节点数量线性扩展的说法.快速浏览'网络'我还没有看到很多关于这个主题的处理.当然,Cassandra中有一些串行处理元素必须限制N增加时的速度.任何关于这个主题的想法,指针或链接都将不胜感激.
编辑以提供透视图:
我正在开发一个项目,该项目具有1,000+节点Cassandra基础结构的当前请求.我没有提出这个规范.我发现自己提出将N减小到200到500之间的范围,每个节点的串行计算速度至少是其两倍.通过对服务器配置进行简单更改,可以轻松实现每个节点的成本损失.