Rog*_*ull 7 int varchar hive join query-performance
多年来,我一直在阅读/听到关于bigint列上的数据库连接的"性能优势" OVER加入(var)char列.
不幸的是,在寻找关于'simlilar type questions'的真实答案/建议时:
我没有看到使用Hive版本(最好是版本1.2.1或更高版本)的示例,其中大型(BIG-DATA-ISH)数据集(假设5亿个+行)连接到类似大小的数据集:
我选择32的大小,因为它是MD5哈希的大小,转换为字符和255,因为它是我所见过的最大自然键的"范围".
此外,我希望Hive:
有没有人知道这样的例子,通过展示Hive Explain计划,CPU,文件和网络资源+查询运行时证明了证据?
| 归档时间: |
|
| 查看次数: |
397 次 |
| 最近记录: |