关于Elasticsearch json dsl查询结构的混淆

Hor*_*ice 9 elasticsearch elastic-stack

在elasticsearch dsl查询语法文档的许多地方,在解释中跳过包装器json查询可能会减少文档大小.但是当我浏览文档时,它一直令人困惑.什么是正式的规则,什么可以或应该去哪里json查询? 换句话说,我试图在所有弹性查询中找到共同的标准或模式,因为我需要构建一个内部api来查询弹性.是否有一个模板包含"query': {}一个"bool":{}或一个filter等内的所有语法组件,我可以在其中填写相关的部分,它仍然运行?

Or *_*ger 7

我还发现Elastic的DSL结构令人困惑,但是在运行了数百个查询后你就会习惯它.

以下是不同类型查询的一些(完整)示例,希望这有助于清除您可能遇到的一些问题,随意在评论中添加方案,我将添加更多示例.

这是标准查询的样子:

{
    "query": {
        "bool": {
            "must": {
                "match": {
                    "message": "abcd"
                }
            }
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

但是,这是过滤后的查询的样子,过滤弹性搜索时,您会发现结构发生了变化:

{
    "query": {
        "filtered": {
            "filter": {
                "term": {
                    "message": "abcd"
                }
            }
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

(阅读有关过滤器和查询之间差异的更多信息)

以下是具有过滤器和查询的查询的外观:

{
    "query": {
        "filtered": {
            "filter": {
                "term": {
                    "message": "abcd"
                }
            },
            "query": {
                "bool": {
                    "must": {
                        "match": {
                            "message2": "bbbb"
                        }
                    }
                }
            }
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

以下是运行具有多个条件的过滤器的方法:

{
    "query": {
        "filtered": {
            "filter": {
                "and": [
                    {
                        "term": {
                            "message": "abcd"
                        }
                    },
                    {
                        "term": {
                            "message2": "abcdd"
                        }
                    }
                ]
            }
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

还有一个更复杂的过滤器:

{
    "query": {
        "filtered": {
            "filter": {
                "and": [
                    {
                        "term": {
                            "message": "abcd"
                        }
                    },
                    {
                        "term": {
                            "message2": "abcdd"
                        }
                    },
                    {
                        "or": [
                            {
                                "term": {
                                    "message3": "abcddx"
                                }
                            },
                            {
                                "term": {
                                    "message4": "abcdd2"
                                }
                            }
                        ]
                    }
                ]
            }
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

使用聚合的简单查询:

{
    "query": {
        "filtered": {
            "filter": {
                "term": {
                    "message": "abcd"
                }
            }
        }
    },
    "aggs": {
        "any_name_will_work_here": {
            "max": {
                "field": "metric1"
            }
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

一个query_string查询:

{
    "query": {
        "query_string": {
            "default_field": "message",
            "query": "this AND that"
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

使用DSL时需要考虑的其他一些事项:

  1. 您可以size在顶层(查询上方)添加一个参数,该参数将决定要返回的结果数量.如果你想要JUST doc计数你可以使用"size": 0哪些不会得到任何结果,只有元数据.
  2. 但是,当使用aggssize参数有一个扭曲时,"size": 0在该aggs字段内设置将告诉ES获取所有聚合桶
  3. DSL结构有例外,在我经常使用的例子中terms,但是range例如有一些不同的结构.