lea*_*man 8 hadoop hive buckets
据我所知,当hive表在一列上聚类时,它会执行该bulkted列的哈希函数,然后将该行数据放入其中一个桶中.并且每个桶都有一个文件,即如果有32个桶,则hdfs中有32个文件.
在多个列上进行聚簇是什么意思?例如,假设该表具有CLUSTERED BY(大陆,国家)INTO 32 BUCKETS.
如果有多个列,如何执行散列函数?
将生成多少个文件?这还是32吗?
希望能帮助到你!!
| 归档时间: |
|
| 查看次数: |
7368 次 |
| 最近记录: |