假设我有一个request_failures用户指标。对于每个用户,我向指标添加一个唯一的标签值。因此,对于用户u1,当请求失败两次时,我得到以下指标:
request_failures{user_name="u1"} 2
Run Code Online (Sandbox Code Playgroud)
我还有一条规则,当出现新的失败时就会触发。其表达式为:
increase(request_failures[1m]) > 0
Run Code Online (Sandbox Code Playgroud)
这对于已经遇到故障的用户来说非常有效。例如,当 u1 遇到第三次失败时,规则就会触发。
当新用户u2的请求失败时,我得到的指标如下:
request_failures{user_name="u1"} 2
request_failures{user_name="u2"} 1
Run Code Online (Sandbox Code Playgroud)
现在的问题是警报规则不会针对u2触发。该规则似乎无法识别“新指标”,尽管所有三个指标都是相同的request_failures,只是具有不同的标签。
任何人都可以指出我应该如何构建规则?