限制输出文件的数量意味着您要限制减速器的数量。您可以借助mapred.reduce.tasksHive shell 的属性来做到这一点。例子 :
hive> set mapred.reduce.tasks = 5;
Run Code Online (Sandbox Code Playgroud)
但它可能会影响查询的性能。或者,getmerge完成查询后,您可以使用 HDFS shell 中的命令。此命令将源目录和目标文件作为输入,并将 src 中的文件连接到目标本地文件中。
用法 :
bin/hadoop fs -getmerge <src> <localdst>
Run Code Online (Sandbox Code Playgroud)
华泰
| 归档时间: |
|
| 查看次数: |
4043 次 |
| 最近记录: |