我想比较以下两个彼此不同的时间序列。我要做的就是将第二时间序列的结果除以第一时间序列的结果,如果值小于1,则生成警报。我使用的查询低于我在下面提到的时间序列。如何实现我的目标?
第一次系列:
container_memory_usage_bytes {container_name =“ documentation”}
结果:
container_memory_usage_bytes{
beta_kubernetes_io_arch="amd64",
beta_kubernetes_io_fluentd_ds_ready="true",
beta_kubernetes_io_instance_type="n1-highmem-8",
beta_kubernetes_io_os="linux",
cloud_google_com_gke_nodepool="pool-1",
container_name="documentation",
failure_domain_beta_kubernetes_io_region="europe-west1",
failure_domain_beta_kubernetes_io_zone="europe-west1-b",
id="/kubepods/burstable/podb79239ff-1ee9-11e8-a6c1-42010a840fd9/3ccdaa6597d5bd306d228e37d9d4c65a9681dba2e894aa7b7ed4502ec54e5619",
image="gcr.io/ingenious-169318/publicapi/documentation@sha256:60a5454bb40ed34f24cbeb9f330e1097191754cf2890eee1ca4f2988188a7705",
instance="gke-ingenious-pool-1-bbd77706-5rbz",
job="kubernetes-cadvisor",
kubernetes_io_hostname="gke-ingenious-pool-1-bbd77706-5rbz",
name="k8s_documentation_documentation-6c4c4c9f5f-dn2bv_apimanager_b79239ff-1ee9-11e8-a6c1-42010a840fd9_0",
namespace="apimanager",
pod_name="documentation-6c4c4c9f5f-dn2bv"
}
Run Code Online (Sandbox Code Playgroud)
第二时间系列:-
kube_pod_container_resource_requests_memory_bytes {container =“ documentation”}
结果:
kube_pod_container_resource_requests_memory_bytes{
container="documentation",
instance="10.32.0.30:8080",
job="kubernetes-service-endpoints",
k8s_app="kube-state-metrics",
kubernetes_name="kube-state-metrics",
kubernetes_namespace="kube-system",
namespace="apimanager",
node="gke-ingenious-pool-1-bbd77706-pdsz",
pod="documentation-6c4c4c9f5f-mzd54"
}
Run Code Online (Sandbox Code Playgroud)
PromQL:
kube_pod_container_resource_requests_memory_bytes {container =“ documentation”} /((container_memory_usage_bytes {namespace =“ apimanager”})
我使用 prometheus operator 在 kubernetes 上部署监控堆栈。我想知道是否有办法知道配置重新加载器部署的配置是否失败。这对于使用配置重新加载器容器重新加载其配置的普罗米修斯和警报管理器资源是有价值的。当配置失败时。我们在容器中有一个日志,但是我们可以收到基于失败的配置重新加载的通知或警报吗?
kubernetes prometheus prometheus-operator prometheus-alertmanager
我正在尝试估计资源 (cpu) 请求和限制值,为此我想使用 prometheus 了解过去一个月 pod 的最大 cpu 使用率。
我检查了这个问题,但无法得到我想要的从 Prometheus 查询中的返回值生成范围向量
我试过了,但似乎 max_over_time 并没有超速工作
max (
max_over_time(
rate(
container_cpu_usage_seconds_total[5m]
)[30d]
)
) by (pod_name)
Run Code Online (Sandbox Code Playgroud)
无效参数“查询”:字符 64 处的解析错误:范围规范必须以度量选择器开头,但要跟在 *promql.Call 之后
我正在安装prometheus来监视K8S,但遇到此错误。你能帮助我吗?非常感谢!!
helm version
Client: &version.Version{SemVer:"v2.13.0",
GitCommit:"79d07943b03aea2b76c12644b4b54733bc5958d6", GitTreeState:"clean"}
Server: &version.Version{SemVer:"v2.13.0",
GitCommit:"79d07943b03aea2b76c12644b4b54733bc5958d6", GitTreeState:"clean"}
helm install stable/prometheus-operator --name prometheus-operator --namespace monitoring
Error: customresourcedefinitions.apiextensions.k8s.io "alertmanagers.monitoring.coreos.com" is forbidden: User "system:serviceaccount:kube-system:default" cannot delete resource "customresourcedefinitions" in API group "apiextensions.k8s.io" at the cluster scope
Run Code Online (Sandbox Code Playgroud) 我最近安装了 Prometheus 并使用 Grafana 进行报告。
我在安装过程中将 Prometheus 设置为保留时间为 1 年:
--storage.tsdb.retention.time=1y
Run Code Online (Sandbox Code Playgroud)
现在,我们从昨天开始注意到 15 天前的数据不再显示。我的代码有问题吗?是1y不是不被认可?
我正在使用 Prometheus Probe CRD 和 Blackbox 导出器来抓取静态目标。但是,当我检查 Blackbox Exporter 时,我根本没有看到指定的目标被探测。
我能够使用 Blackbox 导出器和 Prometheus 导出器值文件中的additionalScrapeConfigs 来探测目标,但它不能与 Probe CRD 一起使用。
这是我的探针自定义对象配置,
kind: Probe
metadata:
name: probe-crd
namespace: prometheus
spec:
jobName: probe-crd
prober:
url: prometheus-blackbox-exporter:9115
targets:
staticConfig:
static:
- https://www.google.com
Run Code Online (Sandbox Code Playgroud)
Blackbox 导出器服务正在端口 9115 上运行。有人可以让我知道我在这里缺少什么吗?
monitoring kubernetes prometheus prometheus-operator prometheus-blackbox-exporter
我已经将 kube-prometheus-stack 作为我的掌舵图中的依赖项安装在 Mac Kubernetes 集群 v1.19.7 的本地 docker 上。我可以查看 kube-prometheus-stack 提供的默认 prometheus 目标。
我有一个 python flask 服务,它提供了我可以在 kubernetes 集群中使用kubectl port forward.
但是,我无法在 prometheus 目标 Web 界面上显示这些指标。
该KUBE-普罗米修斯堆栈文档指出Prometheus.io/scrape不支持服务的基于注解的发现。相反,读者被称为概念ServiceMonitors和PodMonitors。
因此,我已将我的服务配置如下:
---
kind: Service
apiVersion: v1
metadata:
name: flask-api-service
labels:
app: flask-api-service
spec:
ports:
- protocol: TCP
port: 4444
targetPort: 4444
name: web
selector:
app: flask-api-service
tier: backend
type: ClusterIP
---
apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
name: flask-api-service
spec:
selector:
matchLabels:
app: …Run Code Online (Sandbox Code Playgroud) 有没有办法将ratePrometheus中函数的输出转换为整数?
我试图获取指定时间范围内 pod 重新启动的总数,尽管此查询会生成输出,但我得到的结果是小数,这不是我需要的。
rate(kube_pod_container_status_restarts_total{namespace=~"jenkins"}[10h]) * 60 * 5 > 0
Run Code Online (Sandbox Code Playgroud)
我得到的回报是0.21761280931586605但我宁愿得到一个整数。
我只是不确定该使用什么功能。