如何在Amazon EMR上终止正在运行的地图任务?

Eri*_*nge 3 amazon hadoop map emr

我有一个在32个点实例上使用Hadoop 0.20运行的工作.它已经运行了9个小时,没有任何错误.在此期间它已经处理了3800个任务,但我注意到只有两个任务似乎被卡住并且已经独自运行了几个小时(显​​然是因为他们没有超时而做出响应).这些任务通常不会超过15分钟.我不想失去已经完成的所有工作,因为它花了我很多钱.我真的只想杀死这两个任务并让Hadoop重新分配它们或者只是将它们视为失败.直到他们停止,我无法从其他3798地图获得减少结果!

但我无法弄清楚如何做到这一点.我已经考虑过要弄清楚哪些实例正在运行任务,然后终止这些实例,但是

  1. 我不知道如何找出哪些实例是罪魁祸首
  2. 我担心它会产生意想不到的影响.

我如何杀死个别地图任务?

Lor*_*dig 6

通常,在Hadoop集群上,您可以通过发出以下命令来终止特定任务:

hadoop job -kill-task [attempt_id]
Run Code Online (Sandbox Code Playgroud)

这将终止给定的map任务,并在具有新id的不同节点上重新提交它.

为了获得attemp_id在导航Jobtrackerweb UI有问题的地图任务,点击它,注意它的ID(如:attempt_201210111830_0012_m_000000_0)