And*_*dré 5 autoscaling spring-boot kubernetes google-kubernetes-engine
我有一个 GKE 集群(n1-standard-1,主版本 1.13.6-gke.13),有 3 个节点,我有 7 个部署,每个节点都运行一个 Spring Boot 应用程序。为每个部署创建了一个默认的 Horizontal Pod Autoscaler,目标 CPU 为 80%,最少 1 / 最多 5 个副本。
在正常操作期间,每个部署通常有 1 个 Pod,CPU 使用率为 1-5%。但是当应用程序启动时,例如在执行滚动更新后,CPU 使用率会飙升,HPA 会扩展到报告 CPU 使用率达到 500% 或更多的最大副本数。
当多个部署同时启动时,例如集群升级后,经常会导致各种Pod因为CPU不足而无法调度,一些Pod处于“Preemting”状态。
我已将 HPA 更改为最多 2 个副本,因为目前已经足够了。但是我将来会添加更多部署,知道如何正确处理这个会很好。我对 Kubernetes 和 GCP 很陌生,所以我不确定如何解决这个问题。
这是今天早些时候集群升级后其中一个容器的 CPU 图表:
一切都在默认命名空间中运行,我没有使用 100m 默认 CPU 请求触及默认 LimitRange。我应该修改它并设置限制吗?鉴于初始化需要资源,适当的限制是什么?还是我需要升级更多CPU的机器类型?
HPA 仅考虑就绪的 pod。由于您的 Pod 仅在早期阶段经历 CPU 使用率峰值,因此最好的选择是配置一个就绪探针,仅在 CPU 使用率下降或设置的初始延迟秒数长于启动周期时才显示为就绪,以确保峰值出现在HPA 不考虑 CPU 使用率。
| 归档时间: |
|
| 查看次数: |
432 次 |
| 最近记录: |