小编Nik*_*T R的帖子

clickhouse中分区的实际用途是什么?

它表示,分区使删除或移动数据变得更容易,因此仅对有限的数据造成影响。在各种博客中,建议使用月份作为分区键 ( toYYYYMM(date))。在许多地方,还建议不要有超过几个分区。我使用 clickhouse 作为数据库来存储不会频繁删除的时间序列数据。对于大量时间序列数据,建议的分区键是什么?如果我不想频繁删除,是否必须有一个?

在生产中,我注意到启动非常慢,我怀疑分区太多是罪魁祸首。因此,我决定通过从另一个表中选择数据(这样就没有机会优化表)来将新鲜的时间序列数据插入到表中(为大约 200 亿行创建了超过 2300 个分区)进行测试。我立即删除了原来的表并尝试重新启动。很快就10秒左右就完成了。这与我在生产中观察到的 800GB+ 数据完全相反(有许多数据库和表,而不是我的测试节点只有一个表)。

编辑:正如所指出的,我混淆了零件和分区。关于clickhouse的启动时间受到影响,我最好再发一个问题。

clickhouse

3
推荐指数
1
解决办法
1399
查看次数

标签 统计

clickhouse ×1