卡桑德拉分区的大小

Ami*_*van 1 cassandra

在每个Cassandra分区中查找行数的最佳工具是什么?我有一个大分区,我想知道该分区中有多少记录

Chr*_*ink 7

nodetool tablehistograms <keyspace> <table>将为您提供表格的单元格分布和分区的大小。但这并不能确保您确定该分区。要获得特定select的密钥,必须在where子句中指定分区键的查询上使用count(*)。一个很大的分区,但这可能会失败。

sstablemetadata4.0之后的版本基于sstable-tools中的describe命令。如果您提供-s扫描sstable的功能,它将为您提供最大,最大行数的分区以及具有最多逻辑删除的分区。它们可以用于3.0和3.11 sstable。我认为2.1 sstables无法处理。

...
Partitions: 22515                                                               
Rows: 13579337
Tombstones: 0
Cells: 13579337
Widest Partitions: 
  [12345] 999999
  [99049] 62664
  [99007] 60437
  [99017] 59728
  [99010] 59555
Largest Partitions: 
  [12345] 189888705
  [99049] 2965017
  [99007] 2860391
  [99017] 2826094
  [99010] 2818038
...
Run Code Online (Sandbox Code Playgroud)

上面的例子中有parititon键为int,它将打印出如下键:

Widest Partitions: 
  [frodo] 1
Largest Partitions: 
  [frodo] 104
Run Code Online (Sandbox Code Playgroud)