AWS Cloudwatch心跳警报

Lev*_*ron 13 amazon-web-services amazon-cloudwatch

我有一个应用程序,每分钟都会向AWS提供一个自定义Cloudwatch指标.这应该是一个心跳,所以我知道应用程序是活着的.

现在我想对此指标发出警报,以便在心跳停止时通知我.我尝试使用不同的云观察警报统计数据来完成此操作,包括"平均值"和"数据样本",并在给定时间段内设置小于1的警报阈值.但是,在所有情况下,如果我的应用程序死机并停止报告心跳,则警报将仅进入"数据不足"状态,并且永远不会进入"警报"状态.

我知道我可以在"数据不足"状态下发布通知,但我希望这会显示为警报.这可以在Cloudwatch中使用吗?

谢谢,

马特

Bes*_*ces 5

不要将自定义指标推送到Cloudwatch,而是考虑:

按照与您相同的周期性将消息推送到SNS主题,并为SNS主题的NumberOfMessagesPublished指标设置CloudWatch监视器.如果心跳数低于您指定的时间段的预期值,无论是因为应用程序崩溃还是服务器崩溃,度量标准都将进入警报状态.


小智 5

我认为进入“数据不足”状态的警报与处理丢失数据的方式有关。正如文档所述:

类似于每个警报始终处于三种状态之一,报告给 CloudWatch 的每个特定数据点都属于以下三个类别之一:

  • 不违反(在阈值内)
  • 违反(违反阈值)
  • 丢失的

您可以指定警报如何处理丢失的数据点。选择是否将缺失数据点视为:

  • 丢失(警报会及时回溯以查找其他数据点)
  • notBreaching(作为阈值内的数据点处理)
  • 违反(视为违反阈值的数据点)
  • 忽略(保持当前报警状态)

缺少默认行为。

所以我想将丢失的数据点指定为违规可以解决问题:)


Dan*_*iel 5

将缺失数据视为违反阈值(步骤 4)

检查一下: https: //cloudonaut.io/dead-mans-switch-with-cloudwatch/

在此输入图像描述