标签: prometheus-operator

可以在普罗米修斯中比较两个不同的时间序列吗?

我想比较以下两个彼此不同的时间序列。我要做的就是将第二时间序列的结果除以第一时间序列的结果,如果值小于1,则生成警报。我使用的查询低于我在下面提到的时间序列。如何实现我的目标?

第一次系列:

container_memory_usage_bytes {container_name =“ documentation”}

结果:

container_memory_usage_bytes{
   beta_kubernetes_io_arch="amd64",
   beta_kubernetes_io_fluentd_ds_ready="true",
   beta_kubernetes_io_instance_type="n1-highmem-8",
   beta_kubernetes_io_os="linux",
   cloud_google_com_gke_nodepool="pool-1",
   container_name="documentation",
   failure_domain_beta_kubernetes_io_region="europe-west1",
   failure_domain_beta_kubernetes_io_zone="europe-west1-b",
   id="/kubepods/burstable/podb79239ff-1ee9-11e8-a6c1-42010a840fd9/3ccdaa6597d5bd306d228e37d9d4c65a9681dba2e894aa7b7ed4502ec54e5619",
   image="gcr.io/ingenious-169318/publicapi/documentation@sha256:60a5454bb40ed34f24cbeb9f330e1097191754cf2890eee1ca4f2988188a7705",
   instance="gke-ingenious-pool-1-bbd77706-5rbz",
   job="kubernetes-cadvisor",
   kubernetes_io_hostname="gke-ingenious-pool-1-bbd77706-5rbz",
   name="k8s_documentation_documentation-6c4c4c9f5f-dn2bv_apimanager_b79239ff-1ee9-11e8-a6c1-42010a840fd9_0",
   namespace="apimanager",
   pod_name="documentation-6c4c4c9f5f-dn2bv"
}
Run Code Online (Sandbox Code Playgroud)

第二时间系列:-

kube_pod_container_resource_requests_memory_bytes {container =“ documentation”}

结果:

kube_pod_container_resource_requests_memory_bytes{
   container="documentation",
   instance="10.32.0.30:8080",
   job="kubernetes-service-endpoints",
   k8s_app="kube-state-metrics",
   kubernetes_name="kube-state-metrics",
   kubernetes_namespace="kube-system",
   namespace="apimanager",
   node="gke-ingenious-pool-1-bbd77706-pdsz",
   pod="documentation-6c4c4c9f5f-mzd54"
}
Run Code Online (Sandbox Code Playgroud)

PromQL:

kube_pod_container_resource_requests_memory_bytes {container =“ documentation”} /((container_memory_usage_bytes {namespace =“ apimanager”})

prometheus prometheus-operator prometheus-net

2
推荐指数
1
解决办法
2417
查看次数

如何在 prometheus 操作员中获得有关配置重新加载器错误的通知或警报?

我使用 prometheus operator 在 kubernetes 上部署监控堆栈。我想知道是否有办法知道配置重新加载器部署的配置是否失败。这对于使用配置重新加载器容器重新加载其配置的普罗米修斯和警报管理器资源是有价值的。当配置失败时。我们在容器中有一个日志,但是我们可以收到基于失败的配置重新加载的通知或警报吗?

kubernetes prometheus prometheus-operator prometheus-alertmanager

2
推荐指数
1
解决办法
562
查看次数

How to get max cpu useage of a pod in kubernetes over a time interval (say 30 days) in promql?

我正在尝试估计资源 (cpu) 请求和限制值,为此我想使用 prometheus 了解过去一个月 pod 的最大 cpu 使用率。

我检查了这个问题,但无法得到我想要的从 Prometheus 查询中的返回值生成范围向量

我试过了,但似乎 max_over_time 并没有超速工作

max (  
  max_over_time(
    rate(
      container_cpu_usage_seconds_total[5m]
    )[30d]
  )
) by (pod_name)
Run Code Online (Sandbox Code Playgroud)

无效参数“查询”:字符 64 处的解析错误:范围规范必须以度量选择器开头,但要跟在 *promql.Call 之后

kubernetes prometheus promql prometheus-operator

2
推荐指数
1
解决办法
1685
查看次数

安装Prometheus监视Kubernetes集群时出错

我正在安装prometheus来监视K8S,但遇到此错误。你能帮助我吗?非常感谢!!

helm version
Client: &version.Version{SemVer:"v2.13.0", 
GitCommit:"79d07943b03aea2b76c12644b4b54733bc5958d6", GitTreeState:"clean"}
Server: &version.Version{SemVer:"v2.13.0", 
GitCommit:"79d07943b03aea2b76c12644b4b54733bc5958d6", GitTreeState:"clean"}

helm install stable/prometheus-operator --name prometheus-operator --namespace monitoring

Error: customresourcedefinitions.apiextensions.k8s.io "alertmanagers.monitoring.coreos.com" is forbidden: User "system:serviceaccount:kube-system:default" cannot delete resource "customresourcedefinitions" in API group "apiextensions.k8s.io" at the cluster scope
Run Code Online (Sandbox Code Playgroud)

kubernetes prometheus prometheus-operator

1
推荐指数
1
解决办法
1044
查看次数

Prometheus 保留时间设置为 1 年,但保留数据的时间不会超出默认值 15 天

我最近安装了 Prometheus 并使用 Grafana 进行报告。

我在安装过程中将 Prometheus 设置为保留时间为 1 年:

--storage.tsdb.retention.time=1y
Run Code Online (Sandbox Code Playgroud)

现在,我们从昨天开始注意到 15 天前的数据不再显示。我的代码有问题吗?是1y不是不被认可?

prometheus prometheus-operator prometheus-blackbox-exporter

1
推荐指数
1
解决办法
5916
查看次数

Prometheus Probe CRD 不探测目标

我正在使用 Prometheus Probe CRD 和 Blackbox 导出器来抓取静态目标。但是,当我检查 Blackbox Exporter 时,我根本没有看到指定的目标被探测。

我能够使用 Blackbox 导出器和 Prometheus 导出器值文件中的additionalScrapeConfigs 来探测目标,但它不能与 Probe CRD 一起使用。

这是我的探针自定义对象配置,

kind: Probe
metadata:
  name: probe-crd
  namespace: prometheus
spec:
  jobName: probe-crd
  prober:
    url: prometheus-blackbox-exporter:9115
  targets:
    staticConfig:
      static:
      - https://www.google.com
Run Code Online (Sandbox Code Playgroud)

Blackbox 导出器服务正在端口 9115 上运行。有人可以让我知道我在这里缺少什么吗?

monitoring kubernetes prometheus prometheus-operator prometheus-blackbox-exporter

1
推荐指数
1
解决办法
4389
查看次数

如何配置 kube-prometheus-stack helm 安装来抓取 Kubernetes 服务?

我已经将 kube-prometheus-stack 作为我的掌舵图中的依赖项安装在 Mac Kubernetes 集群 v1.19.7 的本地 docker 上。我可以查看 kube-prometheus-stack 提供的默认 prometheus 目标。

我有一个 python flask 服务,它提供了我可以在 kubernetes 集群中使用kubectl port forward.

但是,我无法在 prometheus 目标 Web 界面上显示这些指标。

KUBE-普罗米修斯堆栈文档指出Prometheus.io/scrape不支持服务的基于注解的发现。相反,读者被称为概念ServiceMonitorsPodMonitors

因此,我已将我的服务配置如下:

---
kind:                       Service
apiVersion:                 v1  
metadata:
  name:                     flask-api-service                    
  labels:
    app:                    flask-api-service
spec:
  ports:
    - protocol:             TCP 
      port:                 4444
      targetPort:           4444
      name:                 web 
  selector:
    app:                    flask-api-service                    
    tier:                   backend 
  type:                     ClusterIP
---
apiVersion:                 monitoring.coreos.com/v1
kind:                       ServiceMonitor
metadata:
  name:                     flask-api-service
spec:
  selector:
    matchLabels:
      app: …
Run Code Online (Sandbox Code Playgroud)

kubernetes prometheus kubernetes-helm prometheus-operator

1
推荐指数
1
解决办法
1457
查看次数

Prometheus 率函数输出为整数

有没有办法将ratePrometheus中函数的输出转换为整数?

我试图获取指定时间范围内 pod 重新启动的总数,尽管此查询会生成输出,但我得到的结果是小数,这不是我需要的。

rate(kube_pod_container_status_restarts_total{namespace=~"jenkins"}[10h]) * 60 * 5 > 0
Run Code Online (Sandbox Code Playgroud)

我得到的回报是0.21761280931586605但我宁愿得到一个整数。

我只是不确定该使用什么功能。

kubernetes prometheus promql prometheus-operator

1
推荐指数
1
解决办法
2535
查看次数