Flask 应用程序中的单个 apscheduler 实例

wsp*_*irs 5 python apache httpd.conf apscheduler

设置:

  • Flask 应用程序通过 wsgi 在 Apache 的 httpd 中运行
  • 具有 25 个线程的单个 wsgi 进程:WSGIDaemonProcess myapp threads=25
  • apscheduler 运行作业(发送电子邮件)
  • RethinkDB 作为作业存储的后端

我试图通过阻止 apscheduler 的多个实例启动来阻止 apscheduler 多次运行同一作业。目前我正在使用以下代码来确保调度程序仅启动一次:

    if 'SCHEDULER' not in app.config or app.config['SCHEDULER'] is None:
        logger.info("Configuring scheduler")
        app.config['SCHEDULER'] = scheduler.configure()
Run Code Online (Sandbox Code Playgroud)

但是,当我查看日志时,我看到调度程序启动了两次:

[07:07:56.796001 pid 24778 INFO] main.py 57:Configuring scheduler
[07:07:56.807977 pid 24778 INFO] base.py 132:Scheduler started
[07:07:56.812253 pid 24778 DEBUG] base.py 795:Looking for jobs to run
[07:07:56.818019 pid 24778 DEBUG] base.py 840:Next wakeup is due at-10-14 11:30:00+00:00 (in 1323.187678 seconds)
[07:07:57.919869 pid 24777 INFO] main.py 57:Configuring scheduler
[07:07:57.930654 pid 24777 INFO] base.py 132:Scheduler started
[07:07:57.935212 pid 24777 DEBUG] base.py 795:Looking for jobs to run
[07:07:57.939795 pid 24777 DEBUG] base.py 840:Next wakeup is due at-10-14 11:30:00+00:00 (in 1322.064753 seconds)
Run Code Online (Sandbox Code Playgroud)

从 pid 可以看出,有两个进程正在某处/以某种方式启动。我怎样才能防止这种情况发生?这个配置在httpd的哪里?

假设我确实想要运行两个进程,我可以使用它flock来防止 apscheduler 启动两次。但是,这不起作用,因为不启动 apscheduler 的进程将无法添加/删除作业,因为app.config['SCHEDULER']设置为该进程使用。

配置/设置具有多个进程的 Flask Web 应用程序的最佳方法是什么,这些进程可以添加/删除作业,但又阻止调度程序多次运行作业?

wsp*_*irs 5

我最终决定使用基于文件的锁来确保任务不会运行两次:

def get_lock(name):
    fd = open('/tmp/' + name, 'w')

    try:
        flock(fd, LOCK_EX | LOCK_NB)  # open for exclusive locking
        return fd
    except IOError as e:
        logger.warn('Could not get the lock for ' + str(name))
        fd.close()
        return None


def release_lock(fd):
    sleep(2)  # extend the time a bit longer in the hopes that it blocks the other proc
    flock(fd, LOCK_UN)
    fd.close()
Run Code Online (Sandbox Code Playgroud)

这有点像黑客,但似乎正在工作......