我刚刚发现使用Amazon的Elastic Map Reduce,我可以指定一个步骤来选择三个ActionOnFailure中的一个:
> TERMINATE_JOB_FLOW
> CANCEL_AND_WAIT
>继续
TERMINATE_JOB_FLOW是默认的并且显而易见 – 它在步骤失败时关闭整个群集.
CANCEL_AND_WAIT和CONTINUE有什么区别?在我看来,两者都将保持群集运行,并在添加时继续进行下一步.
假设您已启动群集并
添加了以下3个步骤:
>第1步
> Step2
>第3步
现在,如果Step1将ActionOnFailure作为CANCEL_AND_WAIT,那么在Step1失败的情况下,它将取消所有剩余步骤,并且群集将进入等待状态.我想如果你使用–stay-alive选项来扩展你的集群,那么这是默认行为.
如果Step1将ActionOnFailure作为CONTINUE,它将继续执行Step2.
如果Step1将ActionOnFailure作为TERMINATE_JOB_FLOW,则在Step1失败的情况下,它将按照您的提及关闭群集.
原文链接:https://www.f2er.com/java/121625.html