如何判断导致 Helm Chart 部署失败的原因?

Nom*_*nom 9 kubernetes rancher kubernetes-helm

如果 Helm 部署的状态为failed,我该如何确定导致其失败的原因?

70M*_*ike 13

helm history <release_name>

显示尝试部署该版本时出现的 kubernetes 错误。


Ami*_*ena 10

由于以下 3 个原因,Helm 图表部署可能会失败。

  1. 图表不正确
  2. 部署配置不正确。
  3. 由于某些问题(镜像拉取问题、资源配额)导致容器和服务调度出现问题

可以执行以下步骤进行调试。

图表正确性检查

在本地使用 helm lint 检查图表的正确性

helm lint PATH [flags] Ref: https://helm.sh/docs/helm/helm_lint/

部署配置正确性检查

使用标志 --dry-run --debug 检查建议的部署配置的正确性

helm install <ChartName> --dry-run --debug

Kubernetes集群部署问题检查

要检查诸如容器创建是否由于映像拉取失败而失败或 Pod 由于资源紧缩而未调度等问题,请执行以下诊断。

如果您的部署部署在特定命名空间中(append -n <yournamespace_name>),请在每个命令中添加命名空间标志。留意与您的舵图相关的项目。

kubectl get deployment

kubectl describe deployment <deployment_id_found_in_previos_step>

kubectl get rs

kubectl describe rs <resource_set_id_found_in_previos_step>

kubectl get pods

kubectl describe pods <pod_id_found_in_previos_step>

查看上述每个命令的输出。