Celery '错误:在时间限制内没有节点回复'错误 - 如何调试?

MDa*_*alt 5 python redis celery kubernetes

我遇到了一个以前多次出现的问题,但以前的答案似乎都没有帮助我。

我正在运行带有 Redis 后端的 Celery(通过 Docker/Kubernetes)。我正在使用这个命令:

celery worker --uid 33 -A finimize_django --loglevel=DEBUG -E

(我刚刚将它设置为现在调试)

我正在使用celery==4.3.0redis==3.2.1

每当我跑步时,celery -A app_name status我都会得到:

Error: No nodes replied within time constraint.

奇怪的是芹菜似乎工作正常。我可以看到正在处理的任务,即使我的monitorRedis 内容似乎正在成功运行。几个月来,这在生产中也一直运行良好,直到上周才开始发生这种情况。

它导致了一个问题,因为我的 liveness 探针因为此错误消息而杀死了 pod。

如何调试潜在问题?日志输出中没有任何错误。

谢谢!

Pir*_*jas 1

我有同样的问题或至少非常相似。我已经设法通过固定kombu到 version来修复我的项目中的问题4.6.3。根据celery 的 github 上的这个问题,这是一个4.6.4. 调试确实很隐蔽的问题,但我希望这会有所帮助!