如何在 Stackdriver 日志中检测 GKE 自动升级节点

Mat*_*t R 9 kubernetes google-kubernetes-engine google-cloud-stackdriver

我们有一个带有自动升级节点的 GKE 集群。我们最近注意到一个节点变得不可调度并最终被删除,我们怀疑该节点正在为我们自动升级。有没有办法在 Stackdriver 中确认(或以其他方式)这确实是发生的原因?

小智 14

您可以将以下高级日志查询与 Cloud Logging(以前称为 Stackdriver)结合使用来检测节点池的升级:

protoPayload.methodName="google.container.internal.ClusterManagerInternal.UpdateClusterInternal"
resource.type="gke_nodepool"
Run Code Online (Sandbox Code Playgroud)

主人

protoPayload.methodName="google.container.internal.ClusterManagerInternal.UpdateClusterInternal"
resource.type="gke_cluster"
Run Code Online (Sandbox Code Playgroud)

此外,您可以控制何时使用维护窗口应用更新(如用户 aurelius 提到的)。


aur*_*ius -2

我想你的问题已经在评论中得到了解答。正如 GKE 团队自行决定定期进行额外的自动升级一样。要获得更多控制,您可以创建维护窗口,如此处所述。这基本上是您选择应进行自动升级的时间范围。