Eri*_*nge 3 amazon hadoop map emr
我有一个在32个点实例上使用Hadoop 0.20运行的工作.它已经运行了9个小时,没有任何错误.在此期间它已经处理了3800个任务,但我注意到只有两个任务似乎被卡住并且已经独自运行了几个小时(显然是因为他们没有超时而做出响应).这些任务通常不会超过15分钟.我不想失去已经完成的所有工作,因为它花了我很多钱.我真的只想杀死这两个任务并让Hadoop重新分配它们或者只是将它们视为失败.直到他们停止,我无法从其他3798地图获得减少结果!
但我无法弄清楚如何做到这一点.我已经考虑过要弄清楚哪些实例正在运行任务,然后终止这些实例,但是
我如何杀死个别地图任务?
通常,在Hadoop集群上,您可以通过发出以下命令来终止特定任务:
hadoop job -kill-task [attempt_id]
Run Code Online (Sandbox Code Playgroud)
这将终止给定的map任务,并在具有新id的不同节点上重新提交它.
为了获得attemp_id在导航Jobtracker的web UI有问题的地图任务,点击它,注意它的ID(如:attempt_201210111830_0012_m_000000_0)
| 归档时间: |
|
| 查看次数: |
4139 次 |
| 最近记录: |