Kibana在120秒后关闭HTTP连接

Bom*_*mbe 6 kibana

所以,我和Kibana有这个问题,我不知道如何解决.我将从描述环境开始:

  • 12 Elasticsearch(版本2.1.2)节点.这些是安装了Linux/CentOS的各种AWS机器,使用r3/r4/i3实例类型,分布在三个AZ上.每台机器都有:
    • 800 GiB存储(EBS和SSD)
    • 30 GiB RAM
    • Kibana(4.3.3版)
    • elasticsearch.requestTimeout和elasticsearch.shardTimeout设置为1500000,即1500s,即25分钟.
  • 我们每天创建26个索引,保留12天,其中大多数有12个碎片和1个副本.
  • AWS ELB,用于将请求(非粘性)分发到所有12个节点.
    • ELB的空闲超时为900秒,即15分钟.

现在,当运行更复杂的查询时,Kibana在通过ELB访问时,会在两到三分钟后显示"网关超时"错误消息.Chrome中的网络控制台显示正在触发两个请求,第一个是确定请求的时间跨度的索引,第二个是结果数据的索引.第一个请求需要20到50秒才能成功,第二个请求总是在两分钟后完成504(网关超时).

当Kibana直接针对其中一个Elasticsearch节点运行查询时,查询大约需要7分钟并成功完成.

当没有ELB直接针对其中一个Kibana实例(使用curl)运行查询时,它在几乎两分钟后也会失败.使用Wireshark,我可以看到Kibana在120秒后关闭HTTP连接.

超时来自哪里?我怎么摆脱它?

Bom*_*mbe 3

事实证明,所使用的套接字之一也出现了超时。此拉取请求包含指向可用于修复 Kibana 4.3.3 的部分的提交的链接。