Kubernetes Jobs有"最大重试次数"吗?

alp*_*486 6 google-compute-engine kubernetes

我有批处理作业,我想在Kubernetes上运行.我理解乔布斯的方式:

如果我选择restartPolicy: Never它意味着如果作业失败,它将破坏Pod并重新安排到(可能)另一个节点上.如果restartPolicy: OnFailure,它将重新启动现有Pod中的容器.我认为一定数量的失败是不可恢复的.有没有办法可以防止它在一段时间后重新安排或重新启动并清理不可恢复的作业?

我目前想要解决此问题的方法是让一些监视程序进程查看retryTimes并在指定次数的重试后清理作业.

小智 7

松弛讨论摘要:

不,没有重试限制.但是,您可以在v1.2中设置作业的截止日期activeDeadlineSeconds.系统应该重新启动重新启动,然后在达到截止日期时终止作业.


小智 6

仅供参考,现在已将其添加为.spec.backoffLimit.

https://kubernetes.io/docs/concepts/workloads/controllers/jobs-run-to-completion/