从 Cassandra 中选择所有记录

use*_*012 1 cassandra

我试图从一个 Cassandra 表(~10M 记录)中选择所有记录,这些记录应该使用 CQL shell 分布在 4 个节点上,但每次我这样做时,它都会将输出分区为 1K 记录最大。所以我的问题是,可以一次选择所有记录,因为我试图查看 Cassandra 检索所有记录需要多长时间。

Dmi*_*kiy 5

当您编写“SELECT * from CF”时,CQL 客户端永远不会一次选择所有内容。对于大数据来说,这只是一个愚蠢的行为。相反,它只会加载第一页并为您提供迭代器。Cassandra 从 2.0 版本开始支持自动查询分页。所以你应该调用你的 select all 查询和 ITERATE over pages 来加载完整的列族。请参阅python 客户端的示例。现在无法在 CQL 中一次性加载所有操作,也不应该如此。