我需要在Grafana中显示一个面板,其中包含在右上角选择的时间段内的请求数.
为此,我需要在这里解决2个问题,我将在这里问prometheus问题和另一个链接中的Grafana问题.
如果我有一个计数器http_requests_total
,我如何构建一个查询来获取一个整数,其中包含一段时间内的请求总数(例如:24小时)?
我想将我的 HTTPS 目标 URL 添加到 Prometheus,出现如下错误:
"https://myDomain.dev" is not a valid hostname"
Run Code Online (Sandbox Code Playgroud)
我的域可以使用代理通过 Nginx 和端口 9100 访问和运行(基本上我为节点导出器创建了一个域)
我的配置 prometheus.yml
scrape_configs:
- job_name: 'prometheus'
static_configs:
- targets: ['localhost:9090']
- job_name: 'domain-job'
static_configs:
- targets: ['https://myDomain.dev']
Run Code Online (Sandbox Code Playgroud)
还有什么配置需要添加吗?
即时向量 - 一组时间序列,每个时间序列包含一个样本,所有时间序列共享相同的时间戳。
范围向量 - 一组时间序列,其中包含每个时间序列随时间变化的一系列数据点。
我只能绘制一个即时向量。
当我在表达式中写入时,我得到即时向量:my_metric_name
并且我看到没有时间戳的指标值。那么如何将其绘制成图表呢?如果它现在只有一个值。范围向量似乎更合乎逻辑,因为它具有每个时间戳的值(写作my_metric_name[5m]
)
你能向我解释一下我在这里不明白的这两个向量的外观/工作原理吗?
谢谢你!
我使用领事出口商将我的服务的健康状况和状态摄入普罗米修斯.我想在Consul中的服务和节点状态很关键时发出警报,然后在路由这些警报时使用从Consul中提取的标签.
我从这个讨论中了解到,服务标签可能会作为单独的指标导出,但我不确定如何将一个系列与另一个系列连接起来,因此我可以利用具有健康状态的标签.
例如,以下查询:
max(consul_health_service_status{status="critical"}) by (service_name, status,node) == 1
Run Code Online (Sandbox Code Playgroud)
可以回来:
{node="app-server-02",service_name="app-server",status="critical"} 1
Run Code Online (Sandbox Code Playgroud)
但是我也喜欢这个系列中的'env':
consul_service_tags{node="app-server-02",service_name="app-server",env="prod"} 1
Run Code Online (Sandbox Code Playgroud)
沿节点和service_name连接以将以下内容作为单个系列传递给Alertmanager:
{node="app-server-02",service_name="app-server",status="critical",env="prod"} 1
Run Code Online (Sandbox Code Playgroud)
然后我可以在我的路由中匹配'env'.
有没有办法做到这一点?它并不像我任何操作或功能那样让我能够像这样分组或加入.据我所知,标签已经需要是consul_health_service_status指标上的标签.
我无法确定我的设置的权限到底存在什么问题,如下所示。我已经研究了所有类似的质量检查,但仍然无法解决问题。目的是部署 Prometheus 并让它抓取 /metrics
集群中其他应用程序正常暴露的端点。
Failed to watch *v1.Endpoints: failed to list *v1.Endpoints: endpoints is forbidden: User \\"system:serviceaccount:default:default\\" cannot list resource \\"endpoints\\" in API group \\"\\" at the cluster scope"\nFailed to watch *v1.Pod: failed to list *v1.Pod: pods is forbidden: User \\"system:serviceaccount:default:default\\" cannot list resource \\"pods\\" in API group \\"\\" at the cluster scope"\nFailed to watch *v1.Service: failed to list *v1.Service: services is forbidden: User \\"system:serviceaccount:default:default\\" cannot list resource \\"services\\" in API group \\"\\" at the cluster scope"\n...\n...\n …
Run Code Online (Sandbox Code Playgroud) 直方图(和摘要)时间序列让我对prometheus很感兴趣,但是我无法在promdash或grafana中显示直方图.我期望的是能够展示:
示例度量标准是HTTP服务器的响应时间.
无法创建群集.<>已被指定为"容器引擎管理员"和"容器引擎集群管理员"的角色
Error from server (Forbidden): error when creating "prometheus-
operator/prometheus-operator-cluster-role.yaml":
clusterroles.rbac.authorization.k8s.io "prometheus-operator"
is forbidden: attempt to grant extra privileges: [{[create]
[extensions] [thirdpartyresources] [] []} {[*]
[monitoring.coreos.com] [alertmanagers] [] []} {[*]
[monitoring.coreos.com] [prometheuses] [] []} {[*]
[monitoring.coreos.com] [servicemonitors] [] []} {[*]
[apps] [statefulsets] [] []} {[*] [] [configmaps] [] []}
{[*] [] [secrets] [] []} {[list] [] [pods] [] []} {[delete]
[] [pods] [] []} {[get] [] [services] [] []} {[create]
[] [services] [] []} {[update] [] [services] [] []} {[get] …
Run Code Online (Sandbox Code Playgroud) 您好,我的 AWS 实例上安装了 Prometheus 服务器,但数据在 15 天后自动删除。我需要一年或几个月的数据,我的 prometheus 配置有什么需要改变的吗?或者我是否需要像 Thanos 这样的扩展程序,我是 Prometheus 的新手,所以请轻松回答
prometheus ×10
kubernetes ×2
monitoring ×2
consul ×1
database ×1
grafana ×1
histogram ×1
https ×1
influxdb ×1
minikube ×1
promql ×1
zabbix ×1