alp*_*486 6 google-compute-engine kubernetes
我有批处理作业,我想在Kubernetes上运行.我理解乔布斯的方式:
如果我选择restartPolicy: Never它意味着如果作业失败,它将破坏Pod并重新安排到(可能)另一个节点上.如果restartPolicy: OnFailure,它将重新启动现有Pod中的容器.我认为一定数量的失败是不可恢复的.有没有办法可以防止它在一段时间后重新安排或重新启动并清理不可恢复的作业?
我目前想要解决此问题的方法是让一些监视程序进程查看retryTimes并在指定次数的重试后清理作业.
小智 6
仅供参考,现在已将其添加为.spec.backoffLimit.
https://kubernetes.io/docs/concepts/workloads/controllers/jobs-run-to-completion/
| 归档时间: |
|
| 查看次数: |
1284 次 |
| 最近记录: |