我的系统包括一个任务,它打开网络套接字,从网络接收推送的数据,处理它,然后根据消息将其写入磁盘或ping其他计算机.此任务旨在永久运行,并且该服务旨在使此任务始终运行.但有时它会崩溃.
保持这样的任务活着的最佳做法是什么?假设任务在我们重新启动之前最多可以死30秒.
一些明显的想法包括检查以确保进程仍在运行的监视程序进程.看门狗可以被触发cron.但它如何知道这个过程是否存在?写一个pidfile? touch一个心跳文件?如果机器陷入监视器运行速度超过心跳的程度,理想的解决方案就不会持续增加更多进程.
有没有标准的linux工具?我可以想象一个使用消息队列的解决方案,但我不确定这是不是一个好主意.
根据您希望监视的任务的性质,一种方法是编写一个简单的包装器以在 fork() 中启动您的任务。
然后,包装器任务可以对子任务执行 waitpid() 操作,并在子任务终止时重新启动它。
这确实取决于修改您希望运行的任务的源。
| 归档时间: |
|
| 查看次数: |
489 次 |
| 最近记录: |