监控工具

聊聊监控(三):有关监控工具的最佳实践

前几篇文章中,我列出了软件监控中的一些常见问题,大部分问题都是来自于它们对自身的信息暴露不足。还有一类问题来自于监控软件本身。警报严重程度分级与日志级别类似,很多警报信息也很难在Nagios的严重等级中对号入座(OK/WARN/CRIT/UNKNOWN)。不过,少就是多,而且这种分级法应用广泛,所以最好还是按照它的规则来比较好。抽风的系统抽风(flapping)的系统处于一