我有一个InfluxDB数据库.它存储有关多台机器的一个信息.我在带有标签的这些机器之间分配.我可以使用"按标签分组(机器)"子句一次显示所有三台机器的信息.传说的名称是"table.derivative {machine:1}","table.derivative {machine:2}"等等.如何将其更改为"机器1","机器2"等?
到目前为止,我发现这个建议使用$ groupby(或$ g?),但两者都是字面意思.
我有一个应用程序,当它收到一个特定的 HTTP 请求时,它会增加一个 Prometheus 计数器。该应用程序在 Kubernetes 中运行,具有多个实例并且每天重新部署多次。使用查询http_requests_total{method="POST",path="/resource/aaa",statusClass="2XX"}生成一个图表,按预期显示每个实例的累积请求计数。
我想创建一个 Grafana 图,显示过去 7 天内收到的请求的累积频率。
我的第一个想法是increase(...[7d])为了考虑 7 天窗口之外的任何指标(如图所示),然后sum是这些值。
我已经意识到sum(increase(http_requests_total{method="POST",path="/resource/aaa",statusClass="2XX"}[7d]))事实上确实给出了时间点的正确答案。然而,生成的图表并不完全符合要求,因为组件increase(...) 值会随着一周而增加/减少。
我将如何创建一个图表来显示过去 7 天内这些指标增加的累积总和?例如,给定以下简化数据
| Day | # Requests |
|-----|------------|
| 1 | 10 |
| 2 | 5 |
| 3 | 15 |
| 4 | 10 |
| 5 | 20 |
| 6 | 5 |
| 7 | 5 |
| …Run Code Online (Sandbox Code Playgroud) 我尝试在我的 Kubernetes VM 上获取 Total 和 Free 磁盘空间,以便我可以在其上显示占用空间的百分比。我尝试了名称中包含“文件系统”的各种指标,但没有一个显示正确的总磁盘大小。应该使用哪一个来做到这一点?
这是我尝试过的指标列表
node_filesystem_size_bytes
node_filesystem_avail_bytes
node:node_filesystem_usage:
node:node_filesystem_avail:
node_filesystem_files
node_filesystem_files_free
node_filesystem_free_bytes
node_filesystem_readonly
Run Code Online (Sandbox Code Playgroud) 有没有一种方法可以直接将日志发送给 Loki,而无需使用其代理之一?
例如,如果我有一个 API,是否可以从 API 直接向 Loki 发送请求/响应日志,而不受 Promtail 等的干扰?
从 Grafana 获取 Slack 警报。但它的格式不太好。有没有办法在 Grafana 的 slack 中自定义通知?我正在使用节点导出器导出指标。仪表板从https://grafana.com/grafana/dashboards/1860下载
如何自定义通知,例如:
标题:服务器上的 CPU 负载警报
实例 IP:192.xxxx 值:CPU 使用率 90% 优先级:高
随附了 slack 中的示例输出。
grafana prometheus grafana-api grafana-alerts prometheus-node-exporter
我正在试图找到一种方法来创建一个数据源插件,该插件可以与外部REST API通信并提供相关数据来绘制面板.
有经验的人吗?
我试图将系统正常运行时间显示为 DD-HH-MM-SS 格式,使用通用代码执行此操作不会有问题,但我仅使用 Prometheus (PromQL) 和 Grafana 执行此操作,这是 PromQL 查询:
time()-process_start_time_seconds{instance="INSTANCE",job="JOB"}
我实现了我想要的基本输出,它向我显示了进程的生命周期。上面查询的输出给出了以秒为单位的时间(例如68003),并将其转换为更大的时间单位(分钟、小时等),但采用十进制形式:
小数点后的89指的是一个小时的89%,约53分钟。这并不是一种真正“直观”的显示时间的方式,我希望它能显示该时间的正常 DD:HH:MM:SS 演示,如以下来自一个简单在线工具的屏幕截图,该工具将秒转换为时间:
有没有办法仅使用 PromQL 和 Grafana 配置来实现它?
我正在使用 Docker 在 Fargate 中设置 Grafana。一旦 Grafana 容器处于活动状态,是否有一个我可以调用的端点,Fargate 可以使用该端点来确定容器是否“健康”?
例如:http://grafana/healthy 或 http://grafana/status
谢谢!
我浏览了 PromQL 文档,发现速率有点令人困惑。然后我尝试了 Prometheus 查询仪表板中的一个查询,发现下面给出的结果
Time Count increase rate(count[1m])
15s 4381 0 0
30s 4381 0 0
45s 4381 0 0
1m 4381 0 0
15s 4381 0 0
30s 4402 21 0.700023
45s 4402 0 0.700023
2m 4423 21 0.7
15s 4423 0 0.7
30s 4440 17 0.56666666
45s 4440 0 0.56666666
3m 4456 16 0.53333333
Run Code Online (Sandbox Code Playgroud)
我从仪表板获得的最后一列值,但我无法理解它是如何计算的。
分辨率 - 15 秒
刮擦间隔:30s
grafana ×10
prometheus ×7
promql ×4
grafana-api ×2
aws-fargate ×1
docker ×1
grafana-loki ×1
influxdb ×1
kubernetes ×1
monitoring ×1