Jenkins 在远程 docker 代理中运行 sh 卡住

Alf*_*ang 2 linux jenkins docker docker-compose jenkins-pipeline

问题

我配置了一个远程 docker 实例(在服务器 A 上),可以tcp://server_a:2376为 API 提供服务。

我在服务器 B 上部署了一个 Jenkins 服务器,使用(Dockerjenkinsci/blueocean镜像)。

现在我可以通过 TCP 端口访问服务器 A 上的 Docker 实例:

DOCKER_HOST=tcp://<server_a>:2376 docker ps
DOCKER_HOST=tcp://<server_a>:2376 docker exec some_container "ls"
Run Code Online (Sandbox Code Playgroud)

以上操作都没有问题。

但是,当我制作一个通过 Server-A-Docker 作为代理运行的管道脚本时,问题出现了,命令sh卡住了,并告诉我:

进程显然从未在 /var/jenkins_home/workspace/agent-demo@tmp/durable-1ddcfc03 中启动

(使用 -Dorg.jenkinsci.plugins.durabletask.BourneShellScript.LAUNCH_DIAGNOSTICS=true 临时运行 Jenkins 可能会使问题更清楚)


管道脚本

node {
    docker.withServer('tcp://<server_a>:2376') {
        docker.image('python:latest').inside() {
            sh "python --version"
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

管道控制台输出

在此输入图像描述

Started by user iotsofttest
Running in Durability level: MAX_SURVIVABILITY
[Pipeline] Start of Pipeline
[Pipeline] node
Running on Jenkins in /var/jenkins_home/workspace/agent-demo
[Pipeline] {
[Pipeline] withDockerServer
[Pipeline] {
[Pipeline] isUnix
[Pipeline] sh
+ docker inspect -f . python:latest
.
[Pipeline] withDockerContainer
Jenkins seems to be running inside container 5be8fc34c80a55ddcc2f5399009b97260adfc7ba9ef88985e0f7df614c707b42
but /var/jenkins_home/workspace/agent-demo could not be found among []
but /var/jenkins_home/workspace/agent-demo@tmp could not be found among []
$ docker run -t -d -u 0:0 -w /var/jenkins_home/workspace/agent-demo -v /var/jenkins_home/workspace/agent-demo:/var/jenkins_home/workspace/agent-demo:rw,z -v /var/jenkins_home/workspace/agent-demo@tmp:/var/jenkins_home/workspace/agent-demo@tmp:rw,z -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** -e ******** python:latest cat
$ docker top 25dccce629d42d82b177c79544cdcd2675bad8daf94f11c55f7f9821eb6e052e -eo pid,comm
[Pipeline] {
[Pipeline] sh
process apparently never started in /var/jenkins_home/workspace/agent-demo@tmp/durable-1ddcfc03
(running Jenkins temporarily with -Dorg.jenkinsci.plugins.durabletask.BourneShellScript.LAUNCH_DIAGNOSTICS=true might make the problem clearer)
[Pipeline] }
$ docker stop --time=1 25dccce629d42d82b177c79544cdcd2675bad8daf94f11c55f7f9821eb6e052e
$ docker rm -f 25dccce629d42d82b177c79544cdcd2675bad8daf94f11c55f7f9821eb6e052e
[Pipeline] // withDockerContainer
[Pipeline] }
[Pipeline] // withDockerServer
[Pipeline] }
[Pipeline] // node
[Pipeline] End of Pipeline
ERROR: script returned exit code -2
Finished: FAILURE
Run Code Online (Sandbox Code Playgroud)

我已经在这个问题上浪费了好几天了,有什么想法吗?

Alf*_*ang 5

!!! 最后 !!!

经过几天的多次尝试,我找到了导致问题的关键点。


问题环境的重现

  • 服务器A:使用镜像部署在docker-compose下的Jenkins主节点jenkinsci/blueocean
  • 服务器B:使用镜像部署在docker-compose下的Jenkins代理节点(JNLP)jenkins/inbound-agent:alpine

在此输入图像描述

在两个 Jenkins 主/代理容器内,我将其安装/var/run/docker.sock到其中,以便两个 jenkins 节点都可以访问容器中的 docker,并且agent docker应该在我们的管道中得到支持。

所以现在我制作管道脚本如下:

pipeline {
    agent {
        docker {
            image 'python:latest'
            label 'agent-hkgw'
        }
    }
    stages {
        stage('main') {
            steps {
                sh '''python --version'''
            }
            
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

好吧,当我们构建它时,卡住了:

在此输入图像描述

这就是我在问题中提到的问题。


解决方案

经过多种方式的失败尝试后,我注意到从Jenkins 代理节点Pipeline 构建的容器的挂载卷并未在Jenkins 代理节点中显式声明。所以我尝试将/var/jenkins文件夹从服务器 B挂载到Jenkins 代理容器

在此输入图像描述

然后建成的管道就奇迹般地运转良好了!

在此输入图像描述

希望这对以后遇到同样问题的人有所帮助,感谢您尝试提供帮助的回答。