Jenkins Slave Issue - 无效的流标题:099EACED

use*_*278 5 linux shell jenkins launch-agent jenkins-slave

Jenkins 2.7.4安装在RedHat服务器中,Linux Slaves通过选择"通过执行命令在主服务器上启动代理"选项进行配置.我们创建了一个Shell脚本,它在Jenkins版本2.7.4中运行良好.

现在我们将Jenkins升级到2.121.1.现在,同一个脚本会抛出错误

<=== [JENKINS REMOTING CAPACITY] ===>线程"main"中的异常java.io.StreamCorruptedException:无效的流标题:java.io的java.io.ObjectInputStream.readStreamHeader(ObjectInputStream.java:808)中的099EACED. ObjectInputStream的.(ObjectInputStream.java:301)在hudson.remoting.ObjectInputStreamEx.(ObjectInputStreamEx.java:48)在hudson.remoting.ChannelBuilder.makeTransport(ChannelBuilder.java:478)在hudson.remoting.ChannelBuilder.negotiate(ChannelBuilder.java :433)at hudson.remoting.ChannelBuilder.build(ChannelBuilder.java:354)at hudson.remoting.Launcing.main(Launcher.java:743)at hudson.remoting.Launcher.runWithStdinStdout(Launcher.java:691)at hudson .remoting.Launcher.run(Launcher.java:373)at hudson.remoting.Launcher.main(Launcher.java:283)错误:连接已终止错误:启动代理时出现意外错误.这可能是詹金斯java.io.IOException的错误:在hudson.remoting在hudson.remoting.ChunkedInputStream.readUntilBreak(ChunkedInputStream.java:99)在hudson.remoting.ChunkedCommandTransport.readBlock(ChunkedCommandTransport.java:39)意外EOF. AbstractSynchronousByteArrayCommandTransport.read(AbstractSynchronousByteArrayCommandTransport.java:35)在hudson.remoting.SynchronousCommandTransport $ ReaderThread.run(SynchronousCommandTransport.java:63)ERROR:进程终止,退出代码1 java.io.IOException的:在hudson.remoting.ChunkedInputStream意外EOF. readUntilBreak(ChunkedInputStream.java:99)位于hudson.remoting.AbstractSynteArrayCommandTransport.read(AbstractSynchronousByteArrayCommandTransport.java:35)的hudson.remoting.ChunkedCommandTransport.readBlock(ChunkedCommandTransport.java:39)hudson.remoting.SynchronousCommandTransport $ ReaderThread.run(SynchronousCommandTransport) .java:63)另外:hudson.remoting.Channel $ CallSiteStackTrace:远程调用rtt- cud-euhrhd0036vdeas at hudson.remoting.Channel.attachCallSiteStackTrace(Channel.java:1741)at hudson.remoting.Request.call(Request.java:202)at hudson.remoting.Channel.call(Channel.java:954)at hudson .slaves.SlaveComputer.setChannel(SlaveComputer.java:549)在hudson.slaves.SlaveComputer.setChannel(SlaveComputer.java:416)在hudson.slaves.CommandLauncher.launch(CommandLauncher.java:153)在hudson.slaves.SlaveComputer $ 1 .CALL在java.util.concurrent.FutureTask中(SlaveComputer.java:288)在jenkins.util.ContextResettingExecutorService $ 2.call(ContextResettingExecutorService.java:46)在jenkins.security.ImpersonatingExecutorService $ 2.call(ImpersonatingExecutorService.java:71).运行(未知来源)java.util.concurrent.ThreadPoolExecutor.runWorker(未知来源)java.util.concurrent.ThreadPoolExecutor $ Worker.run(未知来源)java.lang.Thread.run(未知来源)引起:hudson在hudson.remoting.Channel的hudson.remoting.Request.abort(Request.java:340)上的.remoting.RequestAbortedException.终止(Channel.java:1038)在hudson.remoting.SynchronousCommandTransport $ ReaderThread.run(SynchronousCommandTransport.java:96)

如果我在Manage Jenkins - > Configure Security中禁用SSHD端口,那么我就可以启动我的slave.但是在我的脚本中,我将使用Jenkins-cli.jar触发一个作业,将二进制文件从master复制到slave. java -jar jenkins-cli.jar -s http://localhost:8080 --ssh -user username -i ~/.ssh/id_rsa build RTT/RTT-CI-Tools/RTT-CI-Tools-Distribute -s -p SLAVE_REGEX=slave name 我收到的消息是

"WARNING: No header 'X-SSH-Endpoint' returned by Jenkins" 
Run Code Online (Sandbox Code Playgroud)

并且构建不会被触发.我也尝试过在jenkins-cli.jar命令中将-ssh替换为-http,

java -jar jenkins-cli.jar -s http://localhost:8080 -http -auth username:60b3450a883a2519592af84cdcd0d224 build $CI_JOB -s -p SLAVE_REGEX=$SLAVEHOST

它触发了这项工作.再次无法启动从机,

<=== [JENKINS REMOTING CAPACITY] ===>线程"main"中的异常java.io.StreamCorruptedException:无效的流标题:java.io中的java.io.ObjectInputStream.readStreamHeader(ObjectInputStream.java:808)中的099FACED. ObjectInputStream的.(ObjectInputStream.java:301)在hudson.remoting.ObjectInputStreamEx.(ObjectInputStreamEx.java:48)在hudson.remoting.ChannelBuilder.makeTransport(ChannelBuilder.java:478)在hudson.remoting.ChannelBuilder.negotiate(ChannelBuilder.java :433)at hudson.remoting.ChannelBuilder.build(ChannelBuilder.java:354)at hudson.remoting.Launcing.main(Launcher.java:743)at hudson.remoting.Launcher.runWithStdinStdout(Launcher.java:691)at hudson .remoting.Launcher.run(Launcher.java:373)at hudson.remoting.Launcher.main(Launcher.java:283)用法:ssh [-1246AaCfgKkMNnqsTtVvXxYy] [-b bind_address] [-c cipher_spec] [-D [bind_address] :] port] [-e escape_char] [-F configfile] [-i identity_file] [-L [bind_address:] port:host:hostport] [-l login_name] [-m mac_spec] [-O ctl_cmd] [-o选项 ] [-p port] [-R [bind_address:] port:host:hostport] [-S ctl_path] [-W host:port] [-w local_tun [:remote_tun]] [user @] hostname [command]错误:启动代理时出现意外错误.这可能是Jenkins ERROR中的一个错误:Connection终止了java.io.IOException:意外的EOF

如何解决这个问题

小智 4

未改变的标准输入,未改变的标准输出

我相信您的脚本中的某些内容正在篡改标准输入。

您的脚本应将整个未更改的标准输入流传递给 Jenkins 代理进程。

通用解决方案

OP 建立 Jenkins 会话的命令与我的不同,但无论如何,您应该将启动脚本分为 3 个主要部分:

设置:此部分不篡改 stdin 或 stdout。

建立 Jenkins 会话: java -jar jenkins-cli.jar ...

拆解:这部分不篡改 stdin 或 stdout。

#!/bin/bash

function set_up {
    # your set-up code here
}

function tear_down {
    # your tear-down code here
}

function main {
    # set-up (no stdin, no stdout)
    set_up "$@" < /dev/null > /dev/null || exit $?
    # establish Jenkins session
    java -jar jenkins-cli.jar -blah -blah -blah
    # tear-down (no stdin, no stdout)
    tear_down "$@" < /dev/null > /dev/null || exit $?
}
main "$@"
Run Code Online (Sandbox Code Playgroud)

但为什么?

启动脚本的工作是在主服务器和构建代理之间建立一个未被篡改的通信通道(通过标准输入和标准输出)。

              +------------+
"Hello Agent" |            |
   _ _    ----+            +----
    v               Hello Agent  ->
          ----+            +----
              |            |
              |            |  "Hello Master"
          ----+            +----   _ _
       <-  Hello Master             v
          ----+            +----
              |            |
              +------------+
                  launch
                  script
Run Code Online (Sandbox Code Playgroud)

如果这个沟通渠道被篡改,Jenkins 将无法工作。

              +------------+
"Hello Agent" |            |
   _ _    ----+            +-----------
    v            Hel PLZ SEND HELP!! t  ->
          ----+            +-----------
              |            |
              |            |  
          ----+            +----   | |
                                    ^
          ----+            +----
              |            |
              +------------+
                  launch
                  script
Run Code Online (Sandbox Code Playgroud)

如果您没有将任何内容通过管道传输到某些 Unix 命令中,某些 Unix 命令可能会“吞掉”启动脚本的 stdin,从而“破坏”通信通道。考虑以下脚本。

#!/bin/bash

function keep_stdin_intact {
    printf 'I do not consume any stdin, ' >&2
    echo 'and I do not alter the original stdout.' >&2
}

function swallow_stdin {
    echo 'I swallow stdin. Did you see any hexdump below?' >&2
    read yn  # read consumed some stdin
}

echo 'yes' | { keep_stdin_intact; cat -; } | xxd
echo 'yes' | { swallow_stdin; cat -; } | xxd

echo "no you can't now :P" | { swallow_stdin < /dev/null; cat -; } | xxd
Run Code Online (Sandbox Code Playgroud)
  • 第一个yes被通过管道输出并十六进制转储,因为keep_stdin_intact没有篡改标准输入,在本例中为“yes”流。

  • 第二个yes已经消失了,因为swallow_stdin消耗了它,所以cat没有什么可看的,也xdd没有什么可读的。

  • 通过管道传输/dev/null到标准输入吞咽命令,我们保护了自己的标准输入。

ssh 是怎么回事?

ssh是吞噬你的标准输入的邪恶命令之一。

假设您想在agent.jar运行之前删除构建代理上的一些文件。如果没有样板,您可能会想写:

ssh $OPTIONS "$remote" 'sudo rm -rf /var/log/nginx/*'
ssh $OPTIONS "$remote" 'cd $HOME && java -jar agent.jar'
Run Code Online (Sandbox Code Playgroud)

^ 但这是错误的!第一个ssh命令将吞掉您的标准输入,并且 Jenkins 会话将没有任何内容可读取。

第一个ssh必须是“沉默”。/dev/null作为其标准输入传递。

ssh $OPTIONS "$remote" 'sudo rm -rf /var/log/nginx/*' < /dev/null
ssh $OPTIONS "$remote" 'cd $HOME && java -jar agent.jar'
Run Code Online (Sandbox Code Playgroud)