use*_*763 3 monitoring amazon-ec2 amazon-web-services
我一直在使用Copperegg一段时间,直到最近我一直很满意,我遇到了一些问题.它被用于监控必须全天候运行的多个EC2实例.
上周我得到了虚假的警报,说服务器没有,当我没有,我可以应付,但我也没有在我应该做的时候得到警报.当1分钟后触发警报时,一台服务器的CPU占用率超过5分钟.Copperegg的支持并不是那么有用,只是同意应该触发警报.
这些问题的后者是不可接受的,如果它在工作时间之外再次发生,那么将会出现严重的问题.
所以,我正在寻找可以做同样工作的替代服务.我看过Datadog和New Relic,但两者都有一个重大问题,因为他们只会在发生问题5分钟后提醒我一个问题,而不是我可以通过Copperegg得到的1分钟.
还有什么可以做同样的工作,还会与Pager Duty整合?
我相信亚马逊实际上提供的服务可以实现您的目标 - CloudWatch (定价).我将逐一接受你的观点.请注意,我以前没有实际使用它,但文档相当清楚.
当1分钟后触发警报时,一台服务器的CPU占用率超过5分钟
看起来CloudWatch可以配置为在满足条件一分钟后发送警报(我会得到):
实际上,人们可以为许多其他指标设置条件 - 这是我在我的一个实例上看到的,我认为详细的监控(我免费使用)可能会有更多:
还有什么可以做同样的工作,还会与Pager Duty整合?
我假设你在谈论这件事.事实证明,Pager Duty 只是为整合CloudWatch 提供了有用的指南.多好!
这是定价页面,因为您可能想要解析它而不是我告诉您.不过,我将简要介绍一下:
您不希望进行基本监控,因为它只为您提供每五分钟一次的指标(您指出这是不可接受的.)相反,您需要详细监控(每分钟一次).
对于EC2实例,详细监控的价格为每个实例每月 3.50美元.此外,您发出的每个警报每月0.10美元.与CopperEgg的定价相比,这实际上非常便宜- 每次售价70 美元,而9个实例和大量警报可能每月30美元.实际上,你可能会支付更多10美元/月的费用.
Pager Duty的教程建议你使用SNS,这是另一项费用.好事:它很便宜.每百万通知0.60美元.如果您在一年内为SNS获得超过1美元的成本,则需要在服务器上执行一些严重的可靠性改进.
您不仅限于亚马逊预先打包的指标!您实际上可以通过PUT请求向Cloudwatch发送自定义指标(完成cronjob所需的时间等等).非常方便.
提交由您自己的应用程序(或上面未提及的AWS资源)生成的自定义度量标准,并让它们由Amazon CloudWatch监控.您可以通过简单的Put API请求将这些指标提交到Amazon CloudWatch.
(从这里)
总而言之:CloudWatch非常便宜,可以进行1分钟的频率统计,并将与Pager Duty集成.
归档时间: |
|
查看次数: |
4093 次 |
最近记录: |