节点导出器未在集群的 3 个节点上运行

Dmi*_*nov 1 kubernetes prometheus prometheus-node-exporter

我在 AWS EKS 中将节点导出器作为守护程序集运行,今天发现它存在于 10 个节点上,但我的集群有 13 个节点。

如何确保它也在 3 个丢失的节点上运行?

Max*_*bur 5

使用以下方式容忍守护进程集:

tolerations:        
  - effect: NoSchedule         
    operator: Exists
Run Code Online (Sandbox Code Playgroud)

根据文档, DeamonSets 默认情况下已经有一些容忍度。我发布的无关键内容是确保您涵盖以下所有可能的原因NoSchedule

带有运算符 Exists 的空键匹配所有键、值和效果,这意味着这将容忍一切。

这是监视守护进程和日志收集器的常用设置。