如何在聚合中获取特定的 _source 字段

Question

如何在聚合中获取特定的 _source 字段

Poo*_*ony 4 elasticsearch elasticsearch-aggregation

我正在探索 ElasticSearch，用于应用程序，它将处理大量数据并生成一些统计结果。我的要求是检索特定字段的某些统计信息。例如，对于给定的字段，我想检索其唯一值和每个值的文档频率，以及值的长度。值长度与每个文档一起被索引。到目前为止，我已经Terms Aggregation使用以下查询进行了实验：

{
  "size": 0,
  "query": {
  "match_all": {}
},
 "aggs": {
 "type_count": {
   "terms": {
     "field": "val.keyword",
     "size": 100
   }
  }
 }
}

Run Code Online (Sandbox Code Playgroud)

查询返回字段中的所有值val以及每个值出现的文档数。我也希望val_len返回该字段。是否可以使用 ElasticSearch 实现这一目标？换句话说，是否可以_source在存储桶中包含特定字段？我已经浏览了在线提供的文档，但我还没有找到解决方案。希望有人能指出我正确的方向。提前致谢！

我试图以_source以下方式包括：

 "aggs": {
    "type_count": {
     "terms": {
        "field": "val.keyword",
        "size": 100        
      },
        "_source":["val_len"]
    }
  }

Run Code Online (Sandbox Code Playgroud)

和

"aggs": {
 "type_count": {
   "terms": {
     "field": "val.keyword",
     "size": 100,
      "_source":["val_len"]
    }     
  }
}

Run Code Online (Sandbox Code Playgroud)

但我想这不是正确的方法，因为两者都给了我解析错误。

Answer 1

Val*_*Val 9

您需要使用另一个名为的子聚合top_hits，如下所示：

"aggs": {
 "type_count": {
   "terms": {
     "field": "val.keyword",
     "size": 100
    },
    "aggs": {
      "hits": {
        "top_hits": {
          "_source":["val_len"],
          "size": 1
        }
      }
    }
  }
}

Run Code Online (Sandbox Code Playgroud)

另一种方法是使用另一个avg子聚合，以便您也可以对其进行排序

"aggs": {
 "type_count": {
   "terms": {
     "field": "val.keyword",
     "size": 100,
     "order": {
       "length": "desc"
     }
    },
    "aggs": {
      "length": {
        "avg": {
          "field": "val_len"
        }
      }
    }
  }
}

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，10 月前
查看次数：	5154 次
最近记录：	6 年，10 月前