将数据加载到Cassandra列族中的最快方法是什么

Ped*_*nha 3 csv bulk-load loaddata cassandra

我创建了一个Cassandra列族,我需要从该列族的CSV文件中加载数据.csv文件的容量为15 Gb.

我正在使用CQL'COPY FROM'命令,但这需要很长时间才能加载数据.从csv文件向Cassandra加载大量数据的最佳/最简单方法是什么?

Bri*_*anC 5

CQLSH内置的CSV文件副本非常简单,适用于中小型数据集.你没有提到你正在使用哪个Cassandra版本,但在2.1.5(CASSANDRA-8225)中有很多性能改进.

对于更大的数据具有良好结果的替代工具是cassandra-loader.您可以尝试使用文件的子集(如1000行)来确认它是否有效,然后尝试使用整个文件来查看性能.