fre*_*dev 7 kubernetes devops kubernetes-helm
使用 helm 在我的 Kubernetes 集群上部署图表,自从有一天,我无法部署新的或升级现有的。
事实上,每次我使用 helm 时,我都会收到一条错误消息,告诉我无法安装或升级资源。
如果我运行helm install --name foo . -f values.yaml --namespace foo-namespace
我有这个输出:
错误:释放 foo 失败:服务器找不到请求的资源
如果我运行helm upgrade --install foo . -f values.yaml --namespace foo-namespace
或helm upgrade foo . -f values.yaml --namespace foo-namespace
出现此错误:
错误:升级失败:“foo”没有部署的版本
我真的不明白为什么。
这是我的掌舵版本:
Client: &version.Version{SemVer:"v2.12.3", GitCommit:"eecf22f77df5f65c823aacd2dbd30ae6c65f186e", GitTreeState:"clean"}
Server: &version.Version{SemVer:"v2.12.3", GitCommit:"eecf22f77df5f65c823aacd2dbd30ae6c65f186e", GitTreeState:"clean"}
Run Code Online (Sandbox Code Playgroud)
在我的 kubernetes 集群上,当我运行时,我部署了相同版本的分蘖kubectl describe pods tiller-deploy-84b... -n kube-system
:
Name: tiller-deploy-84b8...
Namespace: kube-system
Priority: 0
PriorityClassName: <none>
Node: k8s-worker-1/167.114.249.216
Start Time: Tue, 26 Feb 2019 10:50:21 +0100
Labels: app=helm
name=tiller
pod-template-hash=84b...
Annotations: <none>
Status: Running
IP: <IP_NUMBER>
Controlled By: ReplicaSet/tiller-deploy-84b8...
Containers:
tiller:
Container ID: docker://0302f9957d5d83db22...
Image: gcr.io/kubernetes-helm/tiller:v2.12.3
Image ID: docker-pullable://gcr.io/kubernetes-helm/tiller@sha256:cab750b402d24d...
Ports: 44134/TCP, 44135/TCP
Host Ports: 0/TCP, 0/TCP
State: Running
Started: Tue, 26 Feb 2019 10:50:28 +0100
Ready: True
Restart Count: 0
Liveness: http-get http://:44135/liveness delay=1s timeout=1s period=10s #success=1 #failure=3
Readiness: http-get http://:44135/readiness delay=1s timeout=1s period=10s #success=1 #failure=3
Environment:
TILLER_NAMESPACE: kube-system
TILLER_HISTORY_MAX: 0
Mounts:
/var/run/secrets/kubernetes.io/serviceaccount from helm-token-... (ro)
Conditions:
Type Status
Initialized True
Ready True
ContainersReady True
PodScheduled True
Volumes:
helm-token-...:
Type: Secret (a volume populated by a Secret)
SecretName: helm-token-...
Optional: false
QoS Class: BestEffort
Node-Selectors: <none>
Tolerations: node.kubernetes.io/not-ready:NoExecute for 300s
node.kubernetes.io/unreachable:NoExecute for 300s
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal Scheduled 26m default-scheduler Successfully assigned kube-system/tiller-deploy-84b86cbc59-kxjqv to worker-1
Normal Pulling 26m kubelet, k8s-worker-1 pulling image "gcr.io/kubernetes-helm/tiller:v2.12.3"
Normal Pulled 26m kubelet, k8s-worker-1 Successfully pulled image "gcr.io/kubernetes-helm/tiller:v2.12.3"
Normal Created 26m kubelet, k8s-worker-1 Created container
Normal Started 26m kubelet, k8s-worker-1 Started container
Run Code Online (Sandbox Code Playgroud)
有人遇到过同样的问题吗?
更新:
这是我名为 foo 的实际图表的文件夹结构:图表的结构文件夹:
> templates/
> deployment.yaml
> ingress.yaml
> service.yaml
> .helmignore
> Chart.yaml
> values.yaml
Run Code Online (Sandbox Code Playgroud)
我已经尝试使用删除命令删除失败的图表,helm del --purge foo
但发生了相同的错误。
更准确地说,图表 foo 实际上是使用我自己的私有注册表的自定义图表。ImagePullSecret 正常设置。
我已经运行了这两个命令helm upgrade foo . -f values.yaml --namespace foo-namespace --force
| helm upgrade --install foo . -f values.yaml --namespace foo-namespace --force
我仍然收到一个错误:
UPGRADE FAILED
ROLLING BACK
Error: failed to create resource: the server could not find the requested resource
Error: UPGRADE FAILED: failed to create resource: the server could not find the requested resource
Run Code Online (Sandbox Code Playgroud)
注意 foo-namespace 已经存在。所以错误不是来自命名空间名称或命名空间本身。事实上,如果我运行helm list
,我可以看到foo图表处于FAILED
状态。
Tiller 将所有版本作为 ConfigMap 存储在 Tiller 的命名空间中(kube-system
在您的情况下)。尝试使用以下命令查找损坏的版本并删除它的 ConfigMap:
$ kubectl get cm --all-namespaces -l OWNER=TILLER
NAMESPACE NAME DATA AGE
kube-system nginx-ingress.v1 1 22h
$ kubectl delete cm nginx-ingress.v1 -n kube-system
Run Code Online (Sandbox Code Playgroud)
接下来,手动删除所有发布对象(部署、服务、入口等)并再次使用 helm 重新安装发布。
如果没有帮助,您可以尝试下载较新版本的 Helm(目前为 v2.14.3)并更新/重新安装 Tiller。
归档时间: |
|
查看次数: |
15153 次 |
最近记录: |