在GKE中设置驱逐吊舱警报

Ame*_*meo 3 kubernetes google-kubernetes-engine stackdriver

我遇到的情况是,内存用完后,吊舱有时会被逐出。有什么方法可以设置某种警报,以便在发生这种情况时可以通知我?

实际上,Kubernetes会继续工作并在删除旧的Pod之后重新创建Pod,而且通常要花几小时或几天才能让我意识到根本存在问题。

Ahm*_*gle 9

GKE将Kubernetes事件(kubectl get events)导出到Stackdriver Logging,到“ GKE集群操作”表:

接下来,编写一个专门针对驱逐的查询(我在下面粘贴的查询可能不准确):

在此处输入图片说明

然后点击“创建指标”按钮。

这将创建一个基于日志的指标。在左侧栏中,单击“基于日志的指标”,然后单击此指标的上下文菜单上的“从指标创建警报”选项:

在此处输入图片说明

接下来,您将被带到Stackdriver Alerting门户。您可以根据阈值等在此处设置警报。