Rac*_*hel 0 hadoop hive partitioning
我不清楚hive中分区和分区之间的区别,如果你可以通过示例提供一些细节,我将非常感激.
Pra*_*ati 7
这是Buckets和Partitioning之间的一个很好的区别.
基本上,分区和分段切片用于执行查询的数据比非切片数据更有效.主要区别在于,在修改数据时,在分区的情况下,切片的数量将保持变化,但是通过分段,在创建表时指定的切片数量是固定的.
通过使用哈希算法然后对桶的数量进行模数化来进行跳跃.因此,可能会在任何存储桶中插入一行.Bucketing可用于数据采样,也可用于更有效地连接两个数据集.
归档时间:
12 年,2 月 前
查看次数:
7471 次
最近记录:
10 年,4 月 前