Akka:如何在延迟时间间隔越来越长的情况下安排失败重试？

Question

Akka:如何在延迟时间间隔越来越长的情况下安排失败重试？

Rob*_*ier 10 java error-handling akka akka-supervision

让一个演员在失败时再次尝试一些东西的好方法是什么,但重试之间的时间间隔越来越长？假设我希望演员在15秒后再尝试30秒,然后每分钟再尝试一次.

这是我想出的:

执行实际工作的actor的方法有一个可选 RetryInfo参数,如果存在,则包含我们当前所在的重试次数
失败时,actor会自己发送一个新ScheduleRetryMessage的retryCount + 1,然后抛出一个RuntimeException
另一个演员监督工人演员,使用new OneForOneStrategy(-1, Duration.Inf()返回Resume作为其指令.演员没有状态,所以Resume应该没问题
在收到ScheduleRetryMessage,演员将
- if retryCount < MAX_RETRIES:使用Akka的调度程序安排RetryMessage在所需的延迟之后发送
- 否则:最后放弃,向另一个演员发送消息以进行错误报告

这是一个很好的解决方案还是有更好的方法？

Answer 1

jxs*_*ord 8

你可以有一个启动工人演员的主管.文档的提示是为工作者声明一个大小为1的路由器.主管将跟踪重试次数,然后根据需要安排发送给工作人员的消息.

即使你要创建另一层演员,这对我来说似乎更清晰,因为你会将监督功能保留在工作人员之外.理想情况下,你可以让这个1个主管给n个工人,但我认为你必须使用生命周期监控来从儿童演员那里获得失败.在这种情况下,您可以保留[ActorRef,Int]的地图,以跟踪所有受监管工人的重试次数.监督政策将恢复,但如果您达到最大重试次数,则可以将PoisonPill发送给违规的ActorRef.

Answer 2

小智 7

在这种情况下,我使用标准监督.父/监督角色定义时间窗口内的重试.重试工作者孩子只需重新安排导致失败的消息,并在preRestart()中延迟.

如果重试子项相当复杂,您可以考虑互连一个中间actor.那个演员只是升级了监督.在preRestart上,中间actor调度(延迟)重启消息.当中间actor保持其状态时,它可以简单地重启工作者(具有延迟).

正如您所看到的,延迟部分可能位于preRestart中或工作者的开始时.

归档时间：	13 年，9 月前
查看次数：	5453 次
最近记录：	9 年，6 月前