我是 Elasticsearch 的新手,目前在解决一个相当基本的问题时遇到了一些困难。假设我有以下映射:
PUT /myindex/_mappings/people
{
"properties": {
"name": {"type": "keyword"},
"age" : {"type": "integer"},
}
}
Run Code Online (Sandbox Code Playgroud)
并附有以下文件:
{"name": "Bob", "age": 20},
{"name": "Ben", "age": 25},
{"name": "Eli", "age": 30},
{"name": "Eva", "age": 20},
{"name": "Jan", "age": 21},
{"name": "Jim", "age": 20},
{"name": "Lea", "age": 30},
Run Code Online (Sandbox Code Playgroud)
如何创建一个查询来返回索引中最年长的所有人员?换句话说,我期待 Eli 和 Lea 回来,因为他们都 30 岁了,比其他人都年长。
我正在将 Elasticsearch API 6.0.0 用于 javascript(我的应用程序是用 nodejs 编写的)。现在,我的解决方法是向数据库执行 2 个请求。第一个是聚合最大年龄(应返回 30),然后使用此最大年龄执行另一个请求:
GET /myindex/people/_search
{
"aggs": {
"max_age": {"max": {"field": "age"}}
}
}
GET /myindex/people/_search
{
"query": {"term": {"age": <max_age>}} // where <max_age> should be 30
}
Run Code Online (Sandbox Code Playgroud)
显然,这是非常低效的。您能帮我制定一个可以完成所有这些操作的查询吗?
困难的是我事先不知道有多少文档具有最高值,这意味着我不能使用此处提到的“大小”方法“单个查询查找某些字段具有最大值的文档”
提前致谢!
您可以像这样组合terms和聚合top_hits
GET /myindex/people/_search
{
"size": 0,
"aggs": {
"group_by_age": {
"terms": {
"field": "age",
"order": {
"_term": "desc"
},
"size": 1
},
"aggs": {
"oldest_people": {
"top_hits": {
"from": 0,
"size": 9000
}
}
}
}
}
}
Run Code Online (Sandbox Code Playgroud)
请注意"order": { "_term": "desc" },"size": 1它仅返回聚合中具有最大年龄的存储桶terms。然后我们只列出前 9000 个(或任意数量)带有top_hits.
| 归档时间: |
|
| 查看次数: |
2398 次 |
| 最近记录: |