了解 clickhouse 分区

dsr*_*301 6 clickhouse

我看到 clickhouse 为每个分区键(在每个节点中)创建了多个目录。文档说目录名称格式是:分区 ID_minimum block number_maximum block number_level。知道这里是什么水平吗?一个节点上的 347 个不同的分区键(对于一张表)创建了 1358 个目录。(自定义分区)

文档建议不要有超过 1000 个分区。我们应该记住分区键的数量还是目录的数量?

另外,是否有关于如何控制这个目录数量的配置?

在此处输入图片说明

Amo*_*mos 2

知道这里的等级是多少吗?

Level是LSM-tree的一个概念。MergeTree 表具有将数据部分合并为更大、更深(wrt 级别)的机制。

我们是否应该只记住分区键的数量或目录的数量?

嗯,我认为这不是一个好主意,因为这种方法的扩展性不好。您最好选择低基数列或表达式作为分区键。

另外,是否有关于如何控制这个目录数量的配置?

没有明确的设置。但是您可以轻松地使用模块化表达式来限制分区总数。