标签: prometheus

Prometheus 2.x 限制内存使用

基本上我正在寻找相当于 1.x storage.local.target-heap-size 的东西。

我有一个 prometheus 应用程序（在 6 核、32G 的盒子中运行），它从 2000 个虚拟机中提取主机指标。刮痧间隔5分钟。

在几分钟内，我的 RAM 使用量增加到 29-30GB，后来在 10-15 分钟内，它因 OOM 或服务器从 UI 不可用而死亡。

我们可以通过任何方式告诉普罗米修斯使用定义的最大 RAM 吗？

prometheus

Sub*_*nga

lucky-day

12
推荐指数

0
解决办法

2014
查看次数

使用 Prometheus 和 Grafana 将秒转换为 HH:MM:SS

我试图将系统正常运行时间显示为 DD-HH-MM-SS 格式，使用通用代码执行此操作不会有问题，但我仅使用 Prometheus (PromQL) 和 Grafana 执行此操作，这是 PromQL 查询：

time()-process_start_time_seconds{instance="INSTANCE",job="JOB"}

我实现了我想要的基本输出，它向我显示了进程的生命周期。上面查询的输出给出了以秒为单位的时间（例如68003），并将其转换为更大的时间单位（分钟、小时等），但采用十进制形式：

小数点后的89指的是一个小时的89%，约53分钟。这并不是一种真正“直观”的显示时间的方式，我希望它能显示该时间的正常 DD:HH:MM:SS 演示，如以下来自一个简单在线工具的屏幕截图，该工具将秒转换为时间：

有没有办法仅使用 PromQL 和 Grafana 配置来实现它？

monitoring grafana prometheus promql

arg*_*nza

lucky-day

12
推荐指数

1
解决办法

1万
查看次数

如何从 Prometheus 查询中排除多个标签？

我想从我的查询中排除多个应用程序组...不知道如何去做..我的想法是这样的

count(master_build_state{app_group~! "oss-data-repair", "pts-plan-tech-solution", kubernets_namespace = "etc"} ==0)

Run Code Online (Sandbox Code Playgroud)

我不想包含这两个 app_groups，但我不确定如何在 PromQL 中实现。您可能会添加 () 或 []，但它会引发错误。如果有人可以帮忙请告诉我！

谢谢

grafana telemetry prometheus promql

Col*_*dge

lucky-day

12
推荐指数

2
解决办法

2万
查看次数

如何从联邦端点刮取所有指标？

我们有一个分层prometheus设置与一些服务器刮别人.我们希望让一些服务器从其他服务器中删除所有指标.

目前我们尝试match[]="{__name__=~".*"}"用作度量选择器,但这会产生错误parse error at char 16: vector selector must contain at least one non-empty matcher.

有没有办法从远程prometheus刮掉所有指标而不将每个(前缀)列为匹配选择器？

prometheus

tex*_*tex

lucky-day

11
推荐指数

3
解决办法

5159
查看次数

如何使用Prometheus作为数据源,使用变量引用另一个变量制作Grafana模板？

我有一个带有模板变量的Grafana仪表板services和instances.当我选择一项服务时,如何根据第一个过滤第二个模板变量列表呢？

grafana prometheus

che*_*tts

lucky-day

11
推荐指数

2
解决办法

2万
查看次数

Prometheus为Mac OS X预构建二进制文件

我在Mac OS X上试用Prometheus.我查看了下载内容并没有直接指示哪个版本适用于Mac.我试过docker在Mac上运行Prometheus.只想在不使用docker的Mac上直接运行它.有谁知道要选择哪个版本.

那里有很少的BSD可供挑选.我知道Mac也是BSD.只要它是bsd,不确定哪一个匹配或无关紧要？

除了那些二进制文件,我认为brew install应该做的工作

macos prometheus

Sam*_*sai

2018 01-25

11
推荐指数

1
解决办法

3766
查看次数

如何使用 Promtail / Loki - AlertManager 为我的日志中的每个错误发送警报？

我正在使用 Promtail + Loki 来收集我的日志，但我不知道如何对日志文件中的每个错误发出警报。我也在使用 Prometheus、Alertmanager 和 Grafana。我看到有些人已经成功地做到了这一点，但他们都没有解释细节。需要明确的是，我不是在寻找处于 FIRING 状态的警报或具有“警报”状态的 Grafana 仪表板。我所需要的就是每次在我的一个日志中出现错误时都知道。如果不能完全以这种方式完成，下一个最佳解决方案是每 X 秒抓取一次，然后发出类似“6 条新错误消息”的警报。

prometheus prometheus-alertmanager grafana-loki

EnT*_*nTm

lucky-day

11
推荐指数

1
解决办法

3910
查看次数