我正在使用 Prometheus 2.9.2 来监控大型节点环境。作为在我们的环境中测试 Prometheus 最大规模的一部分,我在我们的测试环境上模拟了大量指标。
我的管理服务器有 16GB 内存和 100GB 磁盘空间。
在规模测试期间,我注意到 Prometheus 进程消耗越来越多的内存,直到进程崩溃。
我注意到 WAL 目录很快就被大量数据文件填满,而 Prometheus 的内存使用量却在上升。
管理服务器每15秒抓取一次节点,存储参数全部设置为默认值。
我想知道为什么会发生这种情况,以及如何/是否可以防止进程崩溃。
谢谢你!