芹菜错过了心跳(on_node_lost)

Dou*_*son 13 python django celery

我刚刚升级到芹菜3.1,现在我看到这是我的原木::

on_node_lost - INFO - missed heartbeat from celery@queue_name for every queue/worker in my cluster.
Run Code Online (Sandbox Code Playgroud)

根据文档BROKER_HEARTBEAT默认关闭,我还没有配置它.

我应该明确设置BROKER_HEARTBEAT=0还是其他我应该检查的东西?

小智 10

看到同样的事情,并注意到日志文件中的一些东西.

1)有关于日志开始时间漂移和偶尔错过心跳的消息.

2)在日志文件的末尾,漂移消息消失,只有错过的心跳消息存在.

3)当漂移消息消失时系统没有变化......它们只是停止出现.

我认为漂移本身可能就是问题本身.

在所有涉及的服务器上同步时间之后,这些消息就消失了.对于ubuntu,将ntpdate作为cron或ntpd运行.


小智 6

芹菜3.1添加了新的混合和八卦程序.我也得到了大量错过的心跳和传递 - 没有八卦给我的工人清理了它.

http://docs.celeryproject.org/en/latest/whatsnew-3.1.html#mingle-worker-synchronization http://docs.celeryproject.org/en/latest/whatsnew-3.1.html#gossip-worker-worker -通讯