在hadoop中并行运行作业

MRK*_*MRK 11 hadoop

我是hadoop的新手.

我已经设置了一个2节点集群.

如何在hadoop中并行运行2个作业.

当我提交作业时,它们按FIFO顺序逐个运行.我必须平行地完成这些工作.如何实现这一目标.

谢谢MRK

Pra*_*ati 13

Hadoop可以配置许多调度程序,默认为FIFO调度程序.

FIFO计划表现如下.

场景1:如果群集具有10个Map Task容量且job1需要15个Map Task,则运行job1将占用整个群集.当job1取得进展并且有可用的空闲插槽时,job1不使用,然后job2在集群上运行.

场景2:如果群集具有10个Map Task容量而job1需要6个Map Task,则job1需要6个槽,job2需要4个槽.job1和job2并行运行.

要从一开始就并行运行作业,您可以根据需要配置Fair SchedulerCapacity Scheduler.必须设置mapreduce.jobtracker.taskscheduler和特定的调度程序参数才能在mapred-site.xml中生效.

编辑:根据MRK的评论更新答案.