我一直在使用Copperegg一段时间,直到最近我一直很满意,我遇到了一些问题.它被用于监控必须全天候运行的多个EC2实例.
上周我得到了虚假的警报,说服务器没有,当我没有,我可以应付,但我也没有在我应该做的时候得到警报.当1分钟后触发警报时,一台服务器的CPU占用率超过5分钟.Copperegg的支持并不是那么有用,只是同意应该触发警报.
这些问题的后者是不可接受的,如果它在工作时间之外再次发生,那么将会出现严重的问题.
所以,我正在寻找可以做同样工作的替代服务.我看过Datadog和New Relic,但两者都有一个重大问题,因为他们只会在发生问题5分钟后提醒我一个问题,而不是我可以通过Copperegg得到的1分钟.
还有什么可以做同样的工作,还会与Pager Duty整合?