齿轮机的错误状况和重试？

Question

齿轮机的错误状况和重试？

Che*_*ian 12 gearman

有人可以指导我在抛出异常或发生错误时如何重试齿轮手？

我在Django应用程序中使用python gearman客户端,我的工作程序是作为Django命令启动的.我从这篇博文中读到,从错误条件重试不是直接的,它需要来自工作者端的sys.exit.

是否已将此修复为使用sendFail或sendException重试？齿轮手也支持使用指数算法重试 - 例如,如果在2,4,8,16秒之后发生SMTP故障重试等等？

Answer 1

Aur*_*mas 25

根据我的理解,Gearman采用了一种非常"不是我的业务"的方法 - 例如,除非工人崩溃,否则它不会干预所执行的工作.任何成功/失败消息都应由客户端处理,而不是由Gearman服务器本身处理.

在前台作业中,这意味着所有sendFail()/ sendException()和其他send*()都指向客户端,由客户决定是否重试作业.这是有道理的,因为有时你可能不需要重试.

在后台作业中,所有send*()功能都失去了意义,因为没有客户端会收听回调.因此,发送的消息将被Gearman忽略.重试作业的唯一条件是工作程序崩溃(可以通过exit(XX)命令模拟,其中XX是非零值).当然,这不是你想要做的事情,因为工作人员通常应该是长时间运行的进程,而不是每次失败的工作后必须重新启动的进程.

就个人而言,我通过扩展默认的GearmanJob类来解决这个问题,我在其中拦截对send*()函数的调用,然后自己实现重试机制.基本上,我将所有与重试相关的数据(最大重试次数,已经重试的次数)与工作负载一起传递,然后自己处理所有内容.这有点麻烦,但我理解为什么Gearman以这种方式工作 - 它只是允许你处理所有的应用程序逻辑.

最后,关于使用指数超时(或任何超时)重试作业的能力.Gearman的有一个功能,添加延迟工作(寻找SUBMIT_JOB_EPOCH的在协议文件),但我不知道它的状态- PHP扩展和,我想,Python模块不支持它和文档说,它可以被删除未来.但我知道它现在有效 - 你只需要向Gearman提交原始套接字请求以实现它(并且指数部分也应该在你身边实现).

但是,这篇博客文章认为SUBMIT_JOB_EPOCH的实现不能很好地扩展.他使用node.js并setTimeout()使其工作,我见过其他人使用unix实用程序at来做同样的事情.无论如何 - Gearman不会为你做这件事.它将专注于可靠性,但会让您专注于所有逻辑.

我知道这是一个老问题的答案,但我看到很多人都在为同样的问题而苦苦挣扎,我相信值得一劳永逸地提供全面的画面. (5认同)

归档时间：	13 年，11 月前
查看次数：	3240 次
最近记录：	11 年，2 月前