如何在C*(Cassandra)中执行高效的SELECT*查询

ham*_*ion 2 database architecture performance cassandra apache-spark

由于表中的大量数据,SELECT*查询似乎效率低下.怎么可能解决这个问题?

对C*基础设施的设计或表本身的设计有什么想法吗?

可能有任何特殊的查询结构来执行选择所有元素更高效?

doa*_*hai 10

由于表中的大量数据,SELECT*查询似乎效率低下.怎么可能解决这个问题?

使用关系数据库,SELECT*FROM无限制== 全表扫描

使用像Cassandra这样的分布式数据库,SELECT*FROM无限制== 完整的CLUSTER扫描,可能在100多台机器的集群上....

长话短说,它不是为全表扫描而设计的.

如果需要扫描表中的所有数据,请使用带有Spark/Cassandra连接器的Apache Spark来完成工作.

可能有任何特殊的查询结构来执行选择所有元素更高效?

不,魔法不存在.如果有人能够非常快速地找到在分布式数据库中执行全表扫描的方法,那么他就已经成为百万富翁了.