是否有可能，如果总是失败，如何限制 kubernetes 作业创建最大数量的 pod？

Question

是否有可能，如果总是失败，如何限制 kubernetes 作业创建最大数量的 pod？

Lei*_*ang 3 kubernetes kubernetes-pod kubernetes-jobs

作为我们公司的 QA，我是 kubernetes 的日常用户，我们使用 kubernetes 作业来创建性能测试 pod。根据文档，工作的优势之一是

创建一个 Job 对象，以便可靠地运行一个 Pod 直至完成

但在我们的测试中，如果之前的 Pod 失败，此功能将创建无限个 Pod，这将占用我们团队共享集群的资源，并且删除这些 Pod 将花费大量时间。看这张图片：

目前的工作清单是这样的：

   {
  "apiVersion": "batch/v1",
  "kind": "Job",
  "metadata": {
    "name": "upgradeperf",
    "namespace": "ntg6-grpc26-tts"
  },
  "spec": {
    "template": {
      "spec": {
        "containers": [
          {
            "name": "upgradeperfjob",
            "image":
"mycompany.com:5000/ncs-cd-qa/upgradeperf:0.1.1",
            "command": [
              "python",
              "/jmeterwork/jmeter.py",
              "-gu",
              "git@gitlab-pri-eastus2.dev.mycompany.net:mobility-ncs-tools/tts-cdqa-tool.git",
              "-gb",
              "upgradeperf",
          "-t",
              "JMeter/testcases/ttssvc/JMeterTestPlan_ttssvc_cmpsize.jmx",
          "-JtestDataFile",
              "JMeter/testcases/ttssvc/testData/avaml_opus.csv",
          "-JthreadNum",
              "3",
          "-JthreadLoopCount",
              "1500",
          "-JresultsFile",
              "results_upgradeperf_cavaml_opus_t3_l1500.csv",
          "-Jhost",
          "mtl-blade32-03.mycompany.com",
          "-Jport",
          "28416"
            ]
          }
        ],
        "restartPolicy": "Never",
        "imagePullSecrets": [
          {
            "name": "docker-registry-secret"
          }
        ]
      }
    }
  }
}

Run Code Online (Sandbox Code Playgroud)

在某些情况下，例如 IP/端口配置错误，“可靠地运行一个 Pod 直至完成”是不可能的，并且重新创建 Pod 会浪费时间和资源。那么是否有可能，如果总是失败，如何限制 kubernetes 作业创建最大数量（比如 3）的 pod？

Answer 1

Kun*_* Li 6

根据您的 kubernetes 版本，您可以使用以下方法解决此问题：

设置选项：restartPolicy: OnFailure，那么失败的容器将在同一个 Pod 中重新启动，因此您不会得到大量失败的 Pod，而是会得到大量重新启动的 Pod。
从 Kubernetes 1.8 开始，有一个参数backoffLimit来控制失败作业的重启策略。该参数定义了将作业视为失败之前作业的重试次数，默认6次。要使该参数起作用，您必须设置该参数restartPolicy: Never。

归档时间：	7 年前
查看次数：	1836 次
最近记录：	7 年前