我正在致力于创建基于 SLO 的监控。到目前为止,我一直在使用 Google 云监控解决方案,例如仪表板、警报和正常运行时间检查。
我注意到 GCP 现在有 Prometheus 托管服务。
我的问题是使用 Prometheus(不仅仅是 Google 管理的)进行监控有什么优势。有什么是使用 Prometheus 可以实现而 Google Cloud Monitoring 无法实现的吗?
google-cloud-platform prometheus google-cloud-monitoring monitoring-query-language
我有一个简单的 Google 云监控查询语言,可以根据基于日志的指标显示对 kubernetes 中所有容器的所有请求的计数。查询如下。
k8s_container::logging.googleapis.com/user/service-api-gateway-prod-request-in-count | sum
Run Code Online (Sandbox Code Playgroud)
小部件将如下所示
我想将折线图的长标签重命名为更短的标签,例如“请求计数”。我该怎么做?
google-cloud-platform google-cloud-monitoring monitoring-query-language
我正在尝试使用 MQL 查询将数据从 Google Cloud Monitoring 导出到 BigQuery 以进行长期存档。我发现按用户分组生成的包含破折号字符(例如“wdl-call-alias”)的元数据标签的查询似乎与 MQL 不兼容。我依赖生成这些标签的第三方系统,并且它们不容易更改。
有没有办法使用 MQL 对包含破折号的元数据标签进行分组?我在下面列出了两个案例,供参考。
使用“sample”标签的工作查询:
fetch gce_instance
| metric 'compute.googleapis.com/instance/cpu/reserved_cores'
| group_by 1m, [value_reserved_cores_mean: mean(value.reserved_cores)]
| every 1m
| group_by [metadata.user.sample: metadata.user_labels.sample],
[value_reserved_cores_mean_aggregate: aggregate(value_reserved_cores_mean)]
Run Code Online (Sandbox Code Playgroud)
使用“wdl-call-alias”标签的损坏查询:
fetch gce_instance
| metric 'compute.googleapis.com/instance/cpu/reserved_cores'
| group_by 1m, [value_reserved_cores_mean: mean(value.reserved_cores)]
| every 1m
| group_by [metadata.user.wdl-call-alias: metadata.user_labels.wdl-call-alias],
[value_reserved_cores_mean_aggregate: aggregate(value_reserved_cores_mean)]
Run Code Online (Sandbox Code Playgroud) prometheus ×1