monit
系统监控工具:monit
Monit是一款功能非常丰富的进程、文件、目录和设备的监测软件,用于Unix平台。它可以自动修复那些已经停止运作的程序,特使适合处理那些由于多种原因导致的软件错误。
Monit 对管理员来说可谓神器也。话说 Nagios 也就是在监控牛,而 Monit 不但本地监控牛,远程服务监控也牛。更牛的是,只要你花点功夫,你的服务就永远都能“死而复生”。
下面例举它的几方面应用:
1. 持续邮件提醒
默认情况下,如果服务Down了,无论他持续 Down 了多久,Monit 只会邮件提醒你一次。下一次提醒,就是服务恢复。
如果希望,在多个周期内,即使服务状态没有变化(持续宕机着),也能收到邮件提醒,那么加上这句:
alert foo@bar with reminder on 10 cycles
此句表示,在10个周期内都会邮件提醒。
2. 误报提醒解决
有些时候,Monit 也会误报,这很正常,任何监控软件都会。大多数是由于网络状况不佳。
再比如我的 amule,Monit 发现停了,又迅速启动了,那就不要来烦我了。别总是一封邮件接着一封。我们这样设置:
if failed host 172.16.5.1 port 8599 for 3 times within 4 cycles then alert
这样就是:若在四个周期内,三次 8599(我的电驴口)端口都无法通,则邮件通知。
很方便!
......
更多资料:http://www.tildeslash.com/monit/