Elastic APM HTTP 错误 (503):队列已满

Man*_*ddy 8 elasticsearch kibana

Kibana 的响应是

{
"statusCode": 500,
"error": "Internal Server Error",
"message": "An internal server error occurred"
}
Run Code Online (Sandbox Code Playgroud)

APM 服务器返回 503 - 内部服务器错误,很难确定根本原因。是否 ES 队列已满或内存不足或集群未正确设置?

根据ES文档:https://www.elastic.co/guide/en/apm/server/master/common-problems.html#queue-full

队列已满通常意味着代理收集的数据多于 APM 服务器能够处理的数据。如果 APM Server 未针对您的 Elasticsearch 集群的大小进行正确配置,或者您的 Elasticsearch 集群功能不足或未针对给定工作负载进行正确配置,则可能会发生这种情况。

如果 Elasticsearch 磁盘空间不足,队列也可能会被填满。

文档无助于确定可能的根本原因。我们如何识别根本原因?

重新启动 Kibana 和 Elasticsearch 会有所帮助,但这无助于确定根本原因

Thi*_*cao 7

您可以尝试增加:

  • 内部队列大小(queue.mem.events
  • Elasticsearch 批量大小 ( output.elasticsearch.bulk_max_size )。

请查看文档:Tune APM Server