使用Prometheus测量服务延迟

eve*_*zon 4 monitoring latency summary grafana prometheus

我是普罗米修斯和格拉那那的新手。

我的主要目标是获得每个请求的响应时间。

对我来说,这似乎是一件简单的事情-但是,无论我做什么,我都无法获得所需的结果。

我需要能够分析最近几分钟/几小时/几天的服务延迟。我发现的当前实现是一个简单的摘要(没有分位数的定义),每15秒就会刮一次。

  1. 是否可以从我的普罗米修斯摘要中获得最后一分钟的平均请求延迟?
  2. 如果是:如何?如果不是:我该怎么办?

目前,我正在使用以下查询:

rate(http_response_time_sum{application="myapp",handler="myHandler", status="200"}[1m])
/
rate(http_response_time_count{application="myapp",handler="myHandler", status="200"}[1m])
Run Code Online (Sandbox Code Playgroud)

我得到两个“数据集”。第一个的值为“ NaN”。我想这是零除的结果。

提前THX!

(使用spring-client)

bri*_*zil 5

您的查询是正确的。如果在过去一分钟内没有查询,则结果为NaN。