每当存在不健康目标时都会收到 TCP LB 警报吗?

Mat*_*ven 2 google-cloud-platform google-cloud-monitoring google-cloud-error-reporting google-cloud-load-balancer

我目前正在使用具有 3 个目标虚拟机的非托管 TCP 负载均衡器,为了提供快速响应,只要健康数量不是 3 个虚拟机中的 3 个,我就需要一个警报系统

有没有办法通过电子邮件、slack 或 GCP 中的 pagerduty 获取有关此问题的警报?

Woj*_*k_B 6

可以创建这样的警报,当组中的实例之一停止正常工作时,该警报会向您发出警报。

转到非托管实例组详细信息页面并将选项卡切换到“监控”:

在此输入图像描述

单击创建警报策略,您将看到另一个面板:

在此输入图像描述

在此屏幕底部,将“条件”更改为“低于”,将“阈值”更改为3,如下所示。

在此输入图像描述

您将发现自己处于策略创建页面: 在此输入图像描述

单击下一步并选择所需的通知渠道,如果您没有看到任何可用的通知渠道,请单击管理通知渠道并创建您想要的通知渠道,可以是电子邮件、短信、Slack 等。




另一种方法是创建由日志触发的警报。

首先,您需要创建健康检查(并启用日志记录)。然后,您转到负载均衡器设置并编辑后端服务,在其中选择您创建的运行状况检查。

在此输入图像描述

然后转到日志资源管理器并选择您的实例组作为日志资源。您将在查询编辑器中看到如下内容:

resource.type="gce_instance_group" resource.labels.instance_group_id="3863333883516335882" resource.labels.instance_group_name="hc-group-1"

然后在底部添加这一行:jsonPayload.healthCheckProbeResult.healthState="UNHEALTHY"

然后单击“运行查询”,这应该会生成一些日志,其中包含可用于触发警报的日志。

在此输入图像描述

现在,当您看到日志时,单击“操作”并选择“创建日志警报”:

在此输入图像描述

您将看到一个窗口,允许您命名警报并选择合适的渠道来发送通知。我刚刚以电子邮件的形式测试了它(2 个虚拟机组,在关闭其中一个虚拟机后触发了警报):

在此输入图像描述

最后 - 根据您正在运行的服务,您可以监视许多不同的服务(在我的例子中,它是端口 80 上的 HTTP 回复)。


归档时间:

查看次数:

1839 次

最近记录:

4 年,4 月 前