我是一名 NOC 操作员,负责监控 Amazon 云应用程序的性能。Ops 团队使用 Graphite 来监控其健康状况,并在其上使用 Grafana 来呈现精美的图表。按照设计,“graphite”每分钟收集一次数据但是我遇到了 Grafana 的一个问题,它在最后一分钟呈现不正确的数据(或未完全收集,请参见下面的屏幕截图)。我可以修吗?
我假设您正在对来自不同来源的多个系列进行 sumSeries()(或类似操作)。当源还没有全部交付数据时,最后一个数据点的总和将太低,因为缺少一些数据。
为了美观地修复它并提供近期的投影,您可以使用该keepLastValue功能。limit在计算查询时,它会重新使用先前的值来最多丢失数据点。这当然是不准确的,但由于它不是持久的,一旦到达,不准确将被实际数据替换。
以较低的限制使用它,并确保监控 Graphite 设置的整体延迟,以在出现问题时注意(否则,keepLastValue 可以轻松隐藏监控问题)。
| 归档时间: |
|
| 查看次数: |
2131 次 |
| 最近记录: |