为特定错误消息设置堆栈驱动程序警报

Pra*_*ant 3 policy alerts google-cloud-functions stackdriver

找不到一种干净的方法来设置有关云函数中错误的 Stackdriver 警报通知

我正在使用云功能将数据处理到云数据存储。我希望收到两种类型的错误警报:

  1. 可能导致功能“崩溃”的技术异常
  2. 我们从云功能记录的自定义错误

我做了以下,

  • 创建了一个搜索特定错误的日志指标(尽管这不适用于“崩溃”,因为错误消息每次都可能不同)
  • 使用以下代码部分中的参数在 Stackdriver 监控中为此指标创建警报

这是根据问题的答案完成的, how to create an alert per error in stackdriver

对于条件的第一个触发器,我收到一封电子邮件。但是,在随后的触发器上,可以说在第二天,我没有。事件也处于“打开”状态。

Resource type: cloud function
Metric:from point 2 above
Aggregation: Aligner: count, Reducer: None, Alignment period: 1m
Configuration: Condition triggers if: Any time series violates, Condition: 
is above, Threshold: 0.001, For: 1 min
Run Code Online (Sandbox Code Playgroud)

所以我有3个问题,

  1. 这是满足我创建警报要求的正确方法吗?

  2. 我如何仍能收到后续错误的警报通知?

  3. 如何自动/手动将事件设置为“已解决”?

You*_*uly 5

我遇到了类似的问题,并且每次至少都能收到一封邮件。“技巧”似乎是使用sum而不是count结合使用for most recent value- 请参见下面的屏幕截图。

这会导致 Stackdriver 在每次找到匹配的日志条目时发送邮件,并在一分钟后关闭问题。

在此处输入图片说明