我的系统
包括一个任务,它打开网络
套接字,从网络接收推送的数据,处理它,然后根据消息将其写入磁盘或ping其他计算机.此任务旨在永久运行,并且该服务旨在使此任务始终运行.但有时它会崩溃.
保持这样的任务活着的最佳做法是什么?假设任务在我们重新启动之前最多可以死30秒.
一些明显的想法包括检查以确保进程仍在运行的监视程序进程.监视器可能由cron触发.但它如何知道这个过程是否存在?写一个pidfile?触摸心跳文件?如果机器陷入监视器运行速度超过心跳的程度,理想的解决方案就不会持续增加更多进程.
有没有标准的linux工具?我可以想象一个使用消息队列的解决方案,但我不确定这是不是一个好主意.
根据您希望监视的任务的性质,一种
方法是编写一个简单的包装器以在fork()中启动您的任务.
然后,包装器任务可以对子进行waitpid()并在终止时重新启动它.
这取决于修改您希望运行的任务的源.