Datadog 监视器在一个指标自另一个指标以来的一段时间内未发生时发出警报

Mar*_*ald 7 datadog

我在设置监视器时遇到问题,当某个事件在另一个事件发生一段时间后没有发生时,该监视器会向我发出警报。基本上,对于我的应用程序中的给定任务,我有一个指示“正在运行”状态的日志和另一个指示“已完成”状态的日志。根据这些日志,我在 datadog 中定义了两个自定义指标。我正在尝试设置一个监视器,当任务开始运行后 2 小时内尚未完成时,该监视器会向我发出警报。例如,如果在 2:00 观察到运行指标,则监视器不应在 4:00 之前发出未完成的警报。如果在 4:00 之前观察到已完成的指标,则监视器不会针对此任务发出警报。

我尝试实现此目的的方法是使用阈值监视器,并从完成的指标计数中减去正在运行的指标计数。然而,这里的挑战是时间增量部分。

我尝试过使用延迟评估(延迟 2 小时),但是,在开始评估时,它只会考虑第一个指标。基本上,只是将窗口向后滑动。