是否有可能复制普罗米修斯?

the*_*spe 3 monitoring prometheus

是否有可能复制普罗米修斯?

例如,有两个 Prometheus 实例。第一个被关闭,第二个接管他的职责。是否可以?我知道有Federation,但在这种情况下,第二个仅在第一个工作时才采样。我不希望第二个实例与第一个实例相同,而是一种副本。

Mic*_*bez 7

您正在询问 Prometheus 的热/温架构高可用性。

你的问题有两个方面:

  1. 数据存储:Prometheus 具有使用远程存储的能力,可以为您的数据提供 HA
  2. 目标的抓取:没有内置的集群抓取机制。
  • 要么两个普罗米修斯同时刮擦(但你有热/热)
  • 或者你找到一种方法来检测 Prometheus 是否已关闭(prometheus 互相刮擦)并触发一个操作(使用 webhook 很容易做到) - 例如启用配置并触发重新加载

如果 HA 对您来说真的很重要,您宁愿:

  • 使用热/热设置与一些代理(如Trikster)或集群(如Thanos)
  • 切换到Cortex,它就像解构的 Prometheus,提供可扩展性和 HA

如果您可以承受 Prometheus 的一些小停机时间,您也可以让调度程序重新调度 Prometheus 并保留数据(也许可以进行远程读/写)。