Vivado Synthesis 挂在 Jenkins 生成的 Docker 容器中

har*_*ess 8 xilinx jenkins docker vivado

我正在尝试将我们的大型 FPGA 构建移动到 Jenkins CI 环境中,但是当在 Jenkins 产生的 Docker 容器中运行时,构建在综合结束时挂起。

我试图复制 Jenkins 创建的环境,但是当我自己生成 Docker 容器时,构建没有问题。

我试过了:

  • 减少 Vivado 使用的作业(又名线程)数量,认为可能在写出日志文件时发生了一些线程冲突
  • 同样,使用-nolog -nojournalvivado 命令上的选项来删除任何日志文件冲突
  • 控制克隆/检出的项目并在 Docker 容器中以本地用户身份运行命令

我还有一个非常小的构建,它可以在 Jenkins 的整个构建过程中毫无问题地完成,所以我认为我的 Docker 容器没有根本性的缺陷。

agent {
  docker {
    image "vivado:2017.4"
    args """
      -v <MOUNT XILINX LICENSE FILE>
      --dns <DNS_ADDRESS>
      --mac-address <MAC_ADDRESS>
    """
  }
}
steps {

  sh "chmod -R 777 ."

  dir(path: "${params.root_dir}") {
    timeout(time: 15, unit: 'MINUTES')  {
      // Create HLS IP for use in Vivado project
      sh './run_hls.sh'
    }
    timeout(time: 20, unit: 'MINUTES')  {
      // Create vivado project, add sources, constraints, HLS IP, generated IP
      sh 'source source_vivado.sh && vivado -mode batch -source tcl/setup_proj.tcl'
    }
    timeout(time: 20,   unit: 'MINUTES')    {
      // Create block designs from TCL scripts
      sh 'source source_vivado.sh && vivado -mode batch -source tcl/run_bd.tcl'
    }
    timeout(time: 1,  unit: 'HOURS')      {
      // Synthesize complete project
      sh 'source source_vivado.sh && vivado -mode batch -source tcl/run_synth.tcl'
    }
  }
}
Run Code Online (Sandbox Code Playgroud)

下面的代码块正在运行 1 个作业,超时为 12 小时。您可以看到 Synthesis 完成,然后在 8 小时后发生超时。

[2019-04-17T00:30:06.131Z] Finished Writing Synthesis Report : Time (s): cpu = 00:01:53 ; elapsed = 00:03:03 . Memory (MB): peak = 3288.852 ; gain = 1750.379 ; free physical = 332 ; free virtual = 28594
[2019-04-17T00:30:06.131Z] ---------------------------------------------------------------------------------
[2019-04-17T00:30:06.131Z] Synthesis finished with 0 errors, 0 critical warnings and 671 warnings.
[2019-04-17T08:38:37.742Z] Sending interrupt signal to process
[2019-04-17T08:38:43.013Z] Terminated
[2019-04-17T08:38:43.013Z] 
[2019-04-17T08:38:43.013Z] Session terminated, killing shell... ...killed.
[2019-04-17T08:38:43.013Z] script returned exit code 143
Run Code Online (Sandbox Code Playgroud)

在本地生成的 Docker 容器中运行相同的命令没有任何问题。不幸的是,timeoutJenkins 步骤似乎没有刷新打开的缓冲区,因为我post:unsuccesful打印出所有日志文件的步骤没有找到synth_1,尽管我不希望与 Jenkins 捕获有任何不同。

Jenkins/Vivado 集成是否存在任何已知问题?有没有办法进入 Jenkins 生成的容器,这样我就可以尝试复制我所期待的和我正在经历的?

编辑:我已经在实际的 tcl 脚本中添加了超时以移过 中wait_on_runs使用的命令run_synth.tcl,但现在我在实现过程中遇到了相同的挂起行为。

LeC*_*uck 5

问题在于 vivado 处理(或不处理……)其分叉进程的方式。具体来说,我认为这适用于并行合成。这也许就是为什么您只在某些项目中看到它的原因。在你上面描述的状态中(在“合成完成”之后卡住了),我注意到了几个废弃的 vivado 僵尸进程。据我了解,这些是结束的子进程,但父进程在结束自己之前没有收集状态。跟踪strace甚至显示 vivado 试图杀死这些进程:

restart_syscall(<... resuming interrupted nanosleep ...>) = 0
kill(319, SIG_0)                     = 0
kill(370, SIG_0)                     = 0
kill(422, SIG_0)                     = 0
kill(474, SIG_0)                     = 0
nanosleep({tv_sec=5, tv_nsec=0}, 0x7f86edcf4dd0) = 0
kill(319, SIG_0)                     = 0
kill(370, SIG_0)                     = 0
kill(422, SIG_0)                     = 0
kill(474, SIG_0)                     = 0
nanosleep({tv_sec=5, tv_nsec=0}, <detached ...>
Run Code Online (Sandbox Code Playgroud)

但是(众所周知)你不能杀死僵尸,它们已经死了......

通常这些进程会被 init 进程采用并在那里处理。但是对于 Docker 中的 Jenkins Pipeline,默认情况下没有 init。管道生成容器并在cat没有输入的情况下运行以使其保持活动状态。这样cat就变成了pid 1,带走了vivado的弃子。cat 当然不知道如何处理它们并忽略它们(真的是悲剧)。

cat,1
  |-(sh,16)
  |-sh,30 -c ...
  |   |-sh,31 -c ...
  |   |   `-sleep,5913 3
  |   `-sh,32 -xe /home/user/.jenkins/workspace...
  |       `-sh,35 -xe /home/user/.jenkins/workspace...
  |           `-vivado,36 /opt/Xilinx/Vivado/2019.2/bin/vivado -mode tcl ...
  |               `-loader,60 /opt/Xilinx/Vivado/2019.2/bin/loader -exec vivado -mode tcl ...
  |                   `-vivado,82 -mode tcl ...
  |                       |-{vivado},84
  |                       |-{vivado},85
  |                       |-{vivado},111
  |                       |-{vivado},118
  |                       `-{vivado},564
  |-(vivado,319)
  |-(vivado,370)
  |-(vivado,422)
  `-(vivado,474)
Run Code Online (Sandbox Code Playgroud)

幸运的是,有一种方法可以在 docker 容器中创建一个 init 进程。用 传递--init参数docker run为我解决了问题。

agent {
    docker {
        image 'vivado:2019.2'
        args '--init'
    }
}
Run Code Online (Sandbox Code Playgroud)

这会创建 vivado 似乎依赖的 init 进程,并且构建运行没有问题。

希望这对你有帮助!

干杯!