我使用Prometheus来衡量业务指标,如:
# HELP items_waiting_total Total number of items in a queue
# TYPE items_waiting_total gauge
items_waiting_total 149
Run Code Online (Sandbox Code Playgroud)
我想保留这些数据非常长期(保留5年),我不需要scrape_interval中的高频率.所以我成立了scrape_interval: "900s".
当我用60s分辨率检查普罗米修斯的图形时,它显示了拍打,但事实并非如此.
问题是,普罗米修斯的最大(推荐)scrape_interval是多少?
我们用sum(rate(my_counter_total[1m]))或用图形表示快速计数器sum(irate(my_counter_total[20s])).如果你总是可以期望在最后几秒内改变,那么第二个是可取的.
但是你如何绘制慢速计数器,你每隔几分钟甚至几小时只有一些增量?具有0.0013232/s的值不是非常人性化的.
假设我想说明有多少用户注册我们的服务(我们希望每小时注册几次).什么是合理的查询?
我们目前使用以下内容来绘制grafana:
3600 * sum(rate(signup_total[1h]))这合理吗?
我仍然试图了解所有这些参数如何一起绘制图形.有人可以解释如何范围选择([10m])时,rate()和irate()功能外,Step并Resolution设置在grafana互相影响?