Celery:陷入无限重复超时(等待 UP 消息超时)

bas*_*kum 5 python timeout celery

我定义了一些时间限制为1200的任务:

@celery.task(time_limit=1200)
def create_ne_list(text):
    c = Client()
    return c.create_ne_list(text)
Run Code Online (Sandbox Code Playgroud)

每次新进程启动时,我还使用worker_process_init信号进行一些初始化:

@worker_process_init.connect
def init(sender=None, conf=None, **kwargs):
    init_system(celery.conf)
    init_pdf(celery.conf)
Run Code Online (Sandbox Code Playgroud)

该初始化函数需要几秒钟的时间来执行。

除此之外,我正在使用以下配置:

CELERY_RESULT_SERIALIZER = 'json'
CELERY_TASK_SERIALIZER = 'json'
CELERY_ACCEPT_CONTENT = ['json']
BROKER_URL = 'amqp://'
CELERY_RESULT_BACKEND = 'amqp://'
CELERY_TIMEZONE = 'Europe/Berlin'
CELERY_ENABLE_UTC = True
Run Code Online (Sandbox Code Playgroud)

并使用以下命令启动我的工作人员:

celery -A isc worker -l info --concurrency=3
Run Code Online (Sandbox Code Playgroud)

正如预期的那样,启动工作程序会导致初始化函数被调用三次。现在,我可以发送任务并且它们正在执行,一切似乎都运行顺利。

但是:一旦任务超过其时间限制,工作人员就会陷入无限循环,因为超过时间限制而再次产生并被杀死。

[2014-06-13 09:46:18,978: ERROR/MainProcess] Timed out waiting for UP message from <Worker(Worker-20381, started daemon)>
[2014-06-13 09:46:20,000: ERROR/MainProcess] Process 'Worker-20381' pid:18953 exited with 'signal 9 (SIGKILL)'
// new worker 20382 getting started, initialization getting triggerd and soon after that -->
[2014-06-13 09:46:18,978: ERROR/MainProcess] Timed out waiting for UP message from <Worker(Worker-20382, started daemon)>
[2014-06-13 09:46:20,000: ERROR/MainProcess] Process 'Worker-20382' pid:18954 exited with 'signal 9 (SIGKILL)'
// and so on....
Run Code Online (Sandbox Code Playgroud)

有谁知道为什么会发生这种情况?

bas*_*kum 5

答案似乎是信号worker_process_init要求处理程序阻塞时间不得超过 4 秒。

http://celery.readthedocs.org/en/latest/userguide/signals.html#worker-process-init

由于我的 init 函数执行时间较长,worker 将自动终止。之后它自然会重新启动并再次触发init函数,从而导致worker再次被终止等等。