linux – 集群机器管理

前端之家收集整理的这篇文章主要介绍了linux – 集群机器管理前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我们的创业公司运行JBoss AS上托管的多项服务.这些服务以其业务而着称,并且为了高可用性和可伸缩性而集群化.

我正在寻找的东西可以:

>获取一组将托管我的服务的Linux机器作为输入,
>获取每项服务的实例数量,
>自动将服务部署到Linux机器上,
>根据某些预定义规则检测并响应故障(重新启动,在备份计算机上安装服务等).

有什么建议?

解决方法

如果没有关于您的要求的更多信息,我建议调查 PuppetChef来处理第1,2和3项.

第4项有点困难 – 你需要一个监控系统(在这里查看,或者询问谷歌.你会收到很多建议),如果你想要自动回复,你的监控系统将不得不提供其他一些系统来接受行动.
这不需要太复杂 – 我使用InterMapper实现了类似的功能:当检测到故障时,InterMapper运行一个“命令行通知程序”来指定发生故障的系统.命令行通知程序只是一个shell脚本,它将系统名称作为参数并重新启动它,如果重新启动失败则发送一封电子邮件.

猜你在找的Linux相关文章