Sum*_*man 7 boto amazon-emr elastic-map-reduce
我刚刚发现使用Amazon的Elastic Map Reduce,我可以指定一个步骤来选择三个ActionOnFailure中的一个:
TERMINATE_JOB_FLOW是默认的并且显而易见 - 它在步骤失败时关闭整个群集.
CANCEL_AND_WAIT和CONTINUE有什么区别?在我看来,两者都将保持群集运行,并在添加时继续进行下一步.
Ama*_*mar 11
假设您已启动群集并添加了以下3个步骤:
现在,如果Step1将ActionOnFailure作为CANCEL_AND_WAIT,则在发生故障时Step1,它将取消所有剩余步骤,并且群集将进入Waiting状态.我想如果你使用--stay-alive选项来扩展你的集群,那么这是默认行为.
如果Step1将ActionOnFailure作为CONTINUE,那么在失败的情况下Step1,它将继续执行Step2.
如果Step1有ActionOnFailure TERMINATE_JOB_FLOW,那么在失败的情况下Step1,它将按照你提到的那样关闭集群.
| 归档时间: |
|
| 查看次数: |
2733 次 |
| 最近记录: |