如何优雅地重启delayed_job消费者?

joe*_*ney 7 capistrano ruby-on-rails delayed-job

我想知道在新代码推送后优雅地重启delayed_job消费者的最佳方法是什么?我正在使用capistrano推送代码,我知道有重启的命令,但是如果当前正在运行的作业,该命令要么挂起(我的部署需要永久),要么强行退出当前正在运行的作业,我会丢失数据.

理想情况下,我希望我的部署发生如下:

  1. 现有的delayed_job使用者使用版本1代码运行
  2. 我运行cap deploy并将第2版代码推送到新服务器
  3. 在部署期间,我们触摸文件以告知delayed_job在处理完当前作业时重新启动.这可以通过一系列不同的方式来完成,但我认为它与乘客如何优雅地重新启动类似
  4. 现有的delayed_job使用者继续使用版本1代码完成当前作业
  5. 当前作业完成,delayed_job消费者发现它需要在继续处理作业之前重新启动
  6. delayed_job使用者自动重启,现在运行版本2代码
  7. delayed_job使用者继续处理作业,现在运行在版本2代码上

我试图通过检查代码的当前版本来插入一些代码以在作业运行之前重新启动,但每次我这样做时,它就会死掉并且实际上不会重新启动任何东西.示例代码如下:

def before(job)
  # check to make sure that the version of code here is the right version of code
  live_git_hash = LIVE_REVISION
  local_git_hash = LOCAL_REVISION

  if live_git_hash != local_git_hash
    # get environment to reload in
    environment = Rails.env # production, development, staging

    # restart the delayed job system
    %x("export RAILS_ENV=#{environment} && ./script/delayed_job restart")
  end
end
Run Code Online (Sandbox Code Playgroud)

它检测到它很好但它在shell调用时死亡.有任何想法吗?

谢谢!

joe*_*ney 5

想出了一个有效的解决方案。

我有一个基类,我所有的延迟作业都继承自称为BaseJob

class BaseJob
  attr_accessor :live_hash

  def before(job)
    # check to make sure that the version of code here is the right version of code
    resp = HTTParty.get("#{Rails.application.config.root_url}/revision")
    self.live_hash = resp.body.strip
  end

  def should_perform()
    return self.live_hash == GIT_REVISION
  end

  def perform()
    if self.should_perform == true
      self.safe_perform()
    end
  end

  def safe_perform()
    # override this method in subclasses
  end

  def success(job)
    if self.should_perform == false
      # log stats here about a failure

      # enqueue a new job of the same kind
      new_job = DelayedJob.new
      new_job.priority = job.priority
      new_job.handler = job.handler
      new_job.queue = job.queue
      new_job.run_at = job.run_at
      new_job.save
      job.delete

      # restart the delayed job system
      %x("export RAILS_ENV=#{Rails.env} && ./script/delayed_job stop")
    else
      # log stats here about a success
    end
  end

end
Run Code Online (Sandbox Code Playgroud)

所有基类都继承BaseJob并重写safe_perform以实际完成它们的工作。关于上述代码的一些假设:

  • Rails.application.config.root_url 指向您的应用程序的根目录(即:www.myapp.com)
  • 有一个暴露的路由叫/revision(即:www.myapp.com/revision)
  • 有一个名为GIT_REVISION您的应用程序知道的全局常量

我最终做的是将 的输出git rev-parse HEAD放在一个文件中并用代码推送它。它会在启动时加载,因此它可以在 web 版本以及 delay_job 消费者中使用。

当我们通过 Capistrano 部署代码时,我们不再停止、启动或重新启动 delay_job 消费者。我们在每分钟运行一次的消费者节点上安装一个 cronjob,并确定 delay_job 进程是否正在运行。如果不是,则会产生一个新的。

由于所有这些,满足以下所有条件:

  • 推送代码不再等待 delay_job 重新启动/强制终止。推送新代码时,正在运行的现有作业将保持不变。
  • 如果消费者正在运行旧代码,我们可以检测到作业何时开始。工作重新排队,消费者自杀。
  • 当一个 delay_job 死掉时,一个新的会通过带有新代码的 cronjob 产生(根据启动 delay_job 的性质,它有新代码)。
  • 如果您对杀死 delay_job 消费者感到偏执,请安装一个 nagios 检查,它与 cron 作业执行相同的操作,但在 delay_job 进程未运行 5 分钟时提醒您。