nagios!我从未在OSX上使用它,但快速的谷歌搜索显示有
nrpe plugins for it.
我在~80 linux和windows服务器的环境中使用nagios,但也有deployments for thousands of servers.
趋势跟踪 – 这里提到的munin – 也是非常好的工具. you can feed critical readings from munin back to nagios.
PS.工具的选择在很大程度上取决于实时的定义.如果从事件发生2分钟延迟到通过短信/电子邮件发送通知是可以的.至少旧版本的nagios不允许更频繁的检查,然后每分钟一次.