弹性Java客户端从HTTP API返回不同的结果

mvr*_*ijn 5 java elasticsearch elasticsearch-5

我有一个使用Elasticsearch Java API(5.6.7)的应用程序来执行聚合查询(术语).我使用curl和HTTP API(显示相关信息)创建了以下搜索文档:

{
  "from" : 0,
  "size" : 0,
  "sort" : [
    {
      "@timestamp" : {
        "order" : "desc"
      }
    }
  ],
  "aggregations" : {
    "level" : {
      "terms" : {
        "field" : "level.keyword",
        "size" : 10,
        "min_doc_count" : 1,
        "shard_min_doc_count" : 0,
        "show_term_doc_count_error" : false,
        "order" : [
          {
            "_count" : "desc"
          },
          {
            "_term" : "asc"
          }
        ]
      }
    }
  }
}
Run Code Online (Sandbox Code Playgroud)

既然已经在我的Java程序中实现了查询,我注意到结果与HTTP API结果不同!

都返回确切的关于碎片相同元信息,点击次数等:

{
  "took": 1,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 3659,
    "max_score": 0.0,
    "hits": [

    ]
  }
Run Code Online (Sandbox Code Playgroud)

但是,从Java API返回的聚合不包含任何存储桶:

  "aggregations": {
    "level": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 0,
      "buckets": [

      ]
    }
Run Code Online (Sandbox Code Playgroud)

虽然HTTP API 的相同聚合确实包含存储桶:

  "aggregations": {
    "level": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 0,
      "buckets": [
        {
          "key": "INFO",
          "doc_count": 2691
        },
        {
          "key": "WARN",
          "doc_count": 776
        },
        {
          "key": "ERROR",
          "doc_count": 192
        }
      ]
    }
Run Code Online (Sandbox Code Playgroud)

我100%确定搜索文档是相同的(从Java应用程序日志中复制它).

问:什么可能导致这种差异?

编辑 我的构建查询的java代码是(包含很多对其他类的引用):

    // Start building the search itself
    SearchRequestBuilder srch = client.prepareSearch(indices.toArray(new String[indices.size()]))
            .setTypes(types.toArray(new String[types.size()])).setFrom(0).setSize(0);
    // Conditional sort order
    if (t.getOrder() != null)
        srch.addSort(t.getOrder().getBuilder());
    // Add aggregationbuilders to this search
    for (NivoStatistic stat : t.getStatistics())
    {
        logger.log(Level.FINER, "Adding statistic {0}", stat.getName());
        srch.addAggregation(stat.getContent());
    }
    // Use a search template    
    NivoQuery qry = t.getQuery();
    SearchTemplateRequestBuilder srchTemplate = new SearchTemplateRequestBuilder(client)
            .setRequest(srch.request())
            .setScript(qry.getTemplateString())
            .setScriptType(ScriptType.INLINE)
            .setScriptParams(qry.getParameterValues())
            ;
    logger.log(Level.FINER, "Prepared search: {0}", srchTemplate.request().getRequest().toString());
Run Code Online (Sandbox Code Playgroud)

上一个日志语句的输出是我用来POST的方法 curl -XPOST http://localhost:9200/...

然后执行通过

    // Execute the search
    try
    {
        SearchResponse resp = srchTemplate.get().getResponse();
        logger.log(Level.FINER, "Search returned: {0}", resp.toString());
        if (resp.status() == RestStatus.OK && resp.getAggregations() != null)
        {
            for (Aggregation agg : resp.getAggregations().asList())
            {
                // Update response
                t.getResponse().addStat(new NivoStatsHit(agg));
            }
        }
    }
    catch (ElasticsearchException e)
    {
        throw new ApiException(ApiExceptionCode.SEARCH_10061, "Database error: " + e.getDetailedMessage());
    }
Run Code Online (Sandbox Code Playgroud)

And*_*fan 3

我开始使用 Elasticserach 5.6.3 测试您的代码,虽然起初看起来可行,但后来我意识到并不那么容易。一切似乎都归结为搜索模板的使用。

您的代码的主要问题是您正在使用与聚合相结合的搜索模板。在我的测试中,甚至没有size工作from;-)。但不确定它对你有什么作用。或者您可能没有意识到结果也会让您取回文件本身,因为它与您的帖子无关。您正在记录的查询看起来确实正确,但结果显示聚合sizefrom被忽略。

因此,此时我开始研究为什么搜索模板和聚合似乎不起作用(仅供参考,resp.getAggregations()返回null)。我发现了这个 - https://github.com/elastic/elasticsearch/issues/22766

我尝试将搜索模板生成器与普通搜索请求结合起来,但失败了。