我们有这个典型的场景:
1列系列,列数少于10个.
当我们收到客户的请求时,我们需要在数据库中写入10 000 000个此列族的记录,我们正在批量编写它们(一批1000个).这通常持续5-10分钟,具体取决于群集中的节点数和复制因子.
在接下来的几个小时内开始写入后,我们将收到大量更新(每条记录更新2次).
所以我们在一天(一小时)的一段时间内有很多写/更新,之后很少.
问题是:提高写入/更新性能的步骤.我注意到例如memtable_flush_queue_size和类似的配置字段,但我没有足够的cassandra经验来确切知道该做什么.
任何建议都有帮助,
伊万
Mac*_*las 12
这可能有助于更好地理解:
http://maciej-miklas.blogspot.de/2012/09/cassanrda-tuning-for-frequent-column.html
http://maciej-miklas.blogspot.de/2012/08/cassandra-11-reading-and-writing-from.html
| 归档时间: |
|
| 查看次数: |
7684 次 |
| 最近记录: |