Kubeflow管道创建容器失败

Joã*_*ias 3 kubernetes kubeflow

我正在本地计算机中运行 Kubeflow,并使用这些步骤通过多通道部署,但是当我尝试运行管道时,它卡住了消息 ContainerCreating。当我运行时,kubectl describe pod train-pipeline-msmwc-1648946763 -n kubeflow我在描述的事件部分发现了这一点:

Events:
  Type     Reason       Age                    From                  Message
  ----     ------       ----                   ----                  -------
  Warning  FailedMount  7m12s (x51 over 120m)  kubelet, kubeflow-vm  Unable to mount volumes for pod "train-pipeline-msmwc-1648946763_kubeflow(45889c06-87cf-4467-8cfa-3673c7633518)": timeout expired waiting for volumes to attach or mount for pod "kubeflow"/"train-pipeline-msmwc-1648946763". list of unmounted volumes=[docker-sock]. list of unattached volumes=[podmetadata docker-sock mlpipeline-minio-artifact pipeline-runner-token-dkvps]
  Warning  FailedMount  2m22s (x67 over 122m)  kubelet, kubeflow-vm  MountVolume.SetUp failed for volume "docker-sock" : hostPath type check failed: /var/run/docker.sock is not a socket file
Run Code Online (Sandbox Code Playgroud)

在我看来,我的部署有问题,但我是 Kubernetes 新手,不知道我现在应该做什么。关于如何解决这个问题有什么想法吗?我不知道它是否有帮助,但我正在从私人 Docker 注册表中提取容器,并且我已经根据此设置了秘密。

小智 5

你不需要使用docker。事实上,问题出workflow-controller-configmap在 kubeflow 名称空间中。您可以使用以下命令编辑它

kubectl edit configmap workflow-controller-configmap -n kubeflow
Run Code Online (Sandbox Code Playgroud)

并更改containerRuntimeExecutor: dockercontainerRuntimeExecutor: pns. 您还可以更改一些步骤并在 mutlitpass 1.21 而不是 1.15 中安装 kubeflow 1.3。不要使用 kubelfow 插件(至少对我不起作用)。您需要按照https://github.com/kubeflow/manifests#installationkustomize 3.2中提到的方式创建清单。