cassandra 写入吞吐量和可扩展性

sun*_*llp 4 scalability cassandra throughput

这可能听起来像一个愚蠢的问题,但我仍然希望有人/专家回答/确认这一点。

假设我有一个 3 节点 cassandra 集群。假设我有一个数据库和一张表。对于这个单表,假设我使用 3 节点 cassandra 获得了 1K 写入/秒的吞吐量。如果明天我在此表上的写入负载增加/扩展到 10K 或 20K,我是否能够通过将集群大小增加 10 倍或 20 倍来处理此写入负载?

我对 cassandra 的理解表明这是可能的(因为 cassandra 既可读写又可扩展),但需要专家确认。

Ash*_*lam 9

是的,Cassandra 具有线性可扩展性。

可扩展性是线性的,如下图所示。每个客户端系统每秒生成约 17,500 个写入请求,并且当我们扩大流量时不存在瓶颈。每个客户端运行 200 个线程来生成跨集群的流量。

在此输入图像描述

资料来源:https://medium.com/netflix-techblog/benchmarking-cassandra-scalability-on-aws-over-a-million-writes-per-second-39f45f066c9e