弹性贴图减少:CANCEL_AND_WAIT和CONTINUE之间的区别?

Sum*_*man 7 boto amazon-emr elastic-map-reduce

我刚刚发现使用Amazon的Elastic Map Reduce,我可以指定一个步骤来选择三个ActionOnFailure中的一个:

  • TERMINATE_JOB_FLOW
  • CANCEL_AND_WAIT
  • 继续

TERMINATE_JOB_FLOW是默认的并且显而易见 - 它在步骤失败时关闭整个群集.

CANCEL_AND_WAIT和CONTINUE有什么区别?在我看来,两者都将保持群集运行,并在添加时继续进行下一步.

Ama*_*mar 11

假设您已启动群集并添加了以下3个步骤:

  • 步骤1
  • 第2步
  • 第三步:

现在,如果Step1将ActionOnFailure作为CANCEL_AND_WAIT,则在发生故障时Step1,它将取消所有剩余步骤,并且群集将进入Waiting状态.我想如果你使用--stay-alive选项来扩展你的集群,那么这是默认行为.

如果Step1将ActionOnFailure作为CONTINUE,那么在失败的情况下Step1,它将继续执行Step2.

如果Step1有ActionOnFailure TERMINATE_JOB_FLOW,那么在失败的情况下Step1,它将按照你提到的那样关闭集群.