在写入节点上创建“Kind”集群失败

Pat*_*ick 5 load-balancing docker kubernetes kind

我正在尝试为我的 kubernetes 集群设置一个kind集群。不幸的是,在写入节点时准备好节点后失败了。我将附上输出和一些信息。预先感谢您的任何帮助!

\n

干杯

\n

错误

\n
$ kind create cluster --config kind-config.yaml \n\nCreating cluster "kind" ...\n \xe2\x9c\x93 Ensuring node image (kindest/node:v1.20.2)  \n \xe2\x9c\x93 Preparing nodes      \n \xe2\x9c\x97 Writing configuration  \nERROR: failed to create cluster: failed to generate kubeadm config content: failed to get kubernetes version from node: failed to get file: command "docker exec --privileged kind-worker3 cat /kind/version" failed with error: exit status 1\nCommand Output: Error response from daemon: Container c41566958be2239a9470ef2ea636c4b21958ee7620086f526954a02e4a605106 is not running\n
Run Code Online (Sandbox Code Playgroud)\n

种类配置yaml

\n
apiVersion: kind.x-k8s.io/v1alpha4\nkind: Cluster\nnodes:\n  - role: control-plane\n  - role: worker\n  - role: worker\n  - role: worker\n\n
Run Code Online (Sandbox Code Playgroud)\n

我的节点

\n
$ kubectl get nodes -o wide\n\nNAME      STATUS   ROLES                  AGE     VERSION   INTERNAL-IP     EXTERNAL-IP   OS-IMAGE       KERNEL-VERSION     CONTAINER-RUNTIME\ngemini    Ready    control-plane,master   3d18h   v1.20.2   192.168.2.203   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13\nphoenix   Ready    <none>                 3d17h   v1.20.2   192.168.2.129   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13\ntaurus    Ready    <none>                 3d17h   v1.20.2   192.168.2.201   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13\nvirgo     Ready    <none>                 3d17h   v1.20.2   192.168.2.202   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13\n\n
Run Code Online (Sandbox Code Playgroud)\n

我的集群上正在运行什么

\n
$ kubectl get all --all-namespaces\n\nNAMESPACE              NAME                                             READY   STATUS    RESTARTS   AGE\ndefault                pod/nginx-6799fc88d8-62cjd                       1/1     Running   1          18h\nkube-system            pod/calico-kube-controllers-86bddfcff-ccrhg      1/1     Running   7          3d18h\nkube-system            pod/calico-node-jddnl                            1/1     Running   4          3d17h\nkube-system            pod/calico-node-nxwlw                            0/1     Running   7          3d18h\nkube-system            pod/calico-node-stnzs                            0/1     Running   0          52s\nkube-system            pod/calico-node-zrxzl                            1/1     Running   4          3d17h\nkube-system            pod/coredns-74ff55c5b-kb2nm                      1/1     Running   7          3d18h\nkube-system            pod/coredns-74ff55c5b-wsgs5                      1/1     Running   7          3d18h\nkube-system            pod/etcd-gemini                                  1/1     Running   8          3d18h\nkube-system            pod/kube-apiserver-gemini                        1/1     Running   8          3d18h\nkube-system            pod/kube-controller-manager-gemini               1/1     Running   11         3d18h\nkube-system            pod/kube-proxy-7fcjz                             1/1     Running   8          3d18h\nkube-system            pod/kube-proxy-84rr7                             1/1     Running   4          3d17h\nkube-system            pod/kube-proxy-lc88w                             1/1     Running   4          3d17h\nkube-system            pod/kube-proxy-v4qd9                             1/1     Running   4          3d17h\nkube-system            pod/kube-scheduler-gemini                        1/1     Running   9          3d18h\nkubernetes-dashboard   pod/dashboard-metrics-scraper-79c5968bdc-mlb4s   1/1     Running   7          3d18h\nkubernetes-dashboard   pod/kubernetes-dashboard-7448ffc97b-nq5c9        1/1     Running   7          3d18h\n\nNAMESPACE              NAME                                TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)                  AGE\ndefault                service/kubernetes                  ClusterIP   10.96.0.1        <none>        443/TCP                  41h\nkube-system            service/calico-etcd                 ClusterIP   10.96.232.136    <none>        6666/TCP                 3d18h\nkube-system            service/calico-typha                ClusterIP   10.109.108.233   <none>        5473/TCP                 3d18h\nkube-system            service/kube-dns                    ClusterIP   10.96.0.10       <none>        53/UDP,53/TCP,9153/TCP   3d18h\nkubernetes-dashboard   service/dashboard-metrics-scraper   ClusterIP   10.110.70.52     <none>        8000/TCP                 3d18h\nkubernetes-dashboard   service/kubernetes-dashboard        NodePort    10.106.194.127   <none>        443:31741/TCP            3d18h\n\nNAMESPACE     NAME                         DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR            AGE\nkube-system   daemonset.apps/calico-node   4         4         2       4            2           kubernetes.io/os=linux   3d18h\nkube-system   daemonset.apps/kube-proxy    4         4         4       4            4           kubernetes.io/os=linux   3d18h\n\nNAMESPACE              NAME                                        READY   UP-TO-DATE   AVAILABLE   AGE\ndefault                deployment.apps/nginx                       1/1     1            1           18h\nkube-system            deployment.apps/calico-kube-controllers     1/1     1            1           3d18h\nkube-system            deployment.apps/coredns                     2/2     2            2           3d18h\nkubernetes-dashboard   deployment.apps/dashboard-metrics-scraper   1/1     1            1           3d18h\nkubernetes-dashboard   deployment.apps/kubernetes-dashboard        1/1     1            1           3d18h\n\nNAMESPACE              NAME                                                   DESIRED   CURRENT   READY   AGE\ndefault                replicaset.apps/nginx-6799fc88d8                       1         1         1       18h\nkube-system            replicaset.apps/calico-kube-controllers-56b44cd6d5     0         0         0       3d18h\nkube-system            replicaset.apps/calico-kube-controllers-86bddfcff      1         1         1       3d18h\nkube-system            replicaset.apps/coredns-74ff55c5b                      2         2         2       3d18h\nkubernetes-dashboard   replicaset.apps/dashboard-metrics-scraper-79c5968bdc   1         1         1       3d18h\nkubernetes-dashboard   replicaset.apps/kubernetes-dashboard-7448ffc97b        1         1         1       3d18h\n
Run Code Online (Sandbox Code Playgroud)\n

Vit*_*Vit 2

答案并不具体,从一开始就做好准备。有一个巨大的关闭Cannot create cluster due to docker exec cat /kind/version failed github 问题而没有解决,但是..

您遇到的问题非常广泛,并且可能有完全不同的根本原因。

BenTheElder - 善良的创建者/维护者

这部分:命令输出:守护程序的错误响应:容器 f2a2d9c8f9c2eca9aeec7f10249eb205b02c8a5f41e5bf1145b5a8e4b63da123 未运行

这告诉我们节点容器没有运行。这要么意味着入口点失败,要么你的主机杀死了它,这要么是由于我们尚未发现的一些不起眼的错误,要么更可能是你的主机环境存在问题。

请提交您自己的问题并提供更多详细信息。这个问题是非具体的,并且已经讨论了许多不同的问题,如上所述。

因此,请在 Github 上创建新问题,现在这个地方很可能最适合解决此类问题。

我还发现您的问题可能来自Docker Installed with Snap。请参阅https://github.com/kubernetes-sigs/kind/issues/1288#issuecomment-631673479。SNAP 的 Docker 知道与 Kind 一起工作的问题,而且它实际上并没有得到 KIND 团队的支持

snap 在已知问题文档中,snap docker 软件包存在许多问题,例如无法访问临时目录。我不推荐 docker 使用 snap,我们也不真正支持它。


一个小注意事项:如果您只是管理集群,我们现在已经解决了大多数 snap 问题,但我仍然不推荐 docker 使用 snap。

如果您看到与此类似的问题,则意味着节点容器由于某种原因提前退出。这通常意味着主机环境已损坏,但有时也意味着我们需要解决问题,例如具有设备映射器问题的不太常见的文件系统。

请尝试使用 kind create cluster --retain 捕获节点日志,并导出日志,并针对上传的日志提出问题。我们将尝试根据这些来确定原因。

编辑:要特别清楚:“由于 docker exec cat /kind/version 失败而无法创建集群”是一种症状,请提交一个包含特定故障详细信息的问题,以便我们在遇到这种情况时可以确定实际的根本原因。

该问题已被锁定,因为它偏离了最初的根本原因,并且一直被用于解决恰好具有相同症状的新问题。这种症状对于节点很早就突然终止的边缘情况很常见,因为这是我们针对正在运行的节点采取的第一个操作。