SSH*_*his 4 aggregation elasticsearch
我有一些看起来像的测试文档
"hits": {
...
"_source": {
"student": "DTWjkg",
"name": "My Name",
"grade": "A"
...
"student": "ggddee",
"name": "My Name2",
"grade": "B"
...
"student": "ggddee",
"name": "My Name3",
"grade": "A"
Run Code Online (Sandbox Code Playgroud)
我想得到成绩为 B 的学生的百分比,结果是“33%”,假设只有 3 个学生。
我将如何在 Elasticsearch 中做到这一点?
到目前为止,我有这个聚合,我觉得很接近:
"aggs": {
"gradeBPercent": {
"terms": {
"field" : "grade",
"script" : "_value == 'B'"
}
}
}
Run Code Online (Sandbox Code Playgroud)
这将返回:
"aggregations": {
"gradeBPercent": {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets": [
{
"key": "false",
"doc_count": 2
},
{
"key": "true",
"doc_count": 1
}
]
}
}
Run Code Online (Sandbox Code Playgroud)
我不一定要寻找一个确切的答案,也许我可以用谷歌搜索术语和关键字。我已经阅读了 elasticsearch 文档,但没有找到任何可以帮助的内容。
首先,您不应该需要此聚合的脚本。如果您想将结果限制在 `value == 'B' 的每个人,那么您应该使用过滤器而不是脚本来做到这一点。
ElasticSearch 不会准确地返回一个百分比,但您可以使用TERMS AGGREGATION的结果轻松计算出该百分比。
例子:
GET devdev/audittrail/_search
{
"size": 0,
"aggs": {
"a1": {
"terms": {
"field": "uIDRequestID"
}
}
}
}
Run Code Online (Sandbox Code Playgroud)
那返回:
{
"took": 12,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 25083,
"max_score": 0,
"hits": []
},
"aggregations": {
"a1": {
"doc_count_error_upper_bound": 9,
"sum_other_doc_count": 1300,
"buckets": [
{
"key": 556,
"doc_count": 34
},
{
"key": 393,
"doc_count": 28
},
{
"key": 528,
"doc_count": 15
}
]
}
}
}
Run Code Online (Sandbox Code Playgroud)
那么这个回报是什么意思呢?
hits.total
字段是与您的查询匹配的记录总数。doc_count
告诉你多少个项都在每个桶。 因此,对于我的示例:我可以说密钥“556”出现在 25083 个文档中的 34 个中,因此它的百分比为 (34 / 25083) * 100