Elasticsearch dsl OR 查询格式

ket*_*tan 2 python-3.x elasticsearch elasticsearch-dsl-py

我有多个文档的索引。文档包含以下字段:

  • 姓名
  • 广告编号
  • 泛号
  • acc_number

我想创建一个 elasticsearch dsl 查询。对于此查询,有两个输入可用,例如 adhar_number 和 pan_number。此查询应与OR 条件匹配。

示例:如果一个文档仅包含提供的 adhar_number,那么我也想要该文档。

我有一本字典,内容如下(my_dict):

{
  "adhar_number": "123456789012",
  "pan_number": "BGPPG4315B"
}
Run Code Online (Sandbox Code Playgroud)

我试过如下:

from elasticsearch import Elasticsearch
from elasticsearch_dsl import Search

es = Elasticsearch([{'host': 'localhost', 'port': 9200}])
s = Search(using=es, index="my_index")
for key, value in my_dict.items():
   s = s.query("match", **{key:value})

print(s.to_dict())
response = s.execute()
print(response.to_dict())
Run Code Online (Sandbox Code Playgroud)

它创建以下查询:

{
  'query': {
    'bool': {
      'must': [
        {
          'match': {
            'adhar_number': '123456789012'
          }
        },
        {
          'match': {
            'pan_number': 'BGPPG4315B'
          }
        }
      ]
    }
  }
}
Run Code Online (Sandbox Code Playgroud)

上面的代码为我提供了AND 条件而不是OR 条件的结果

请向我提出包含 OR 条件的好建议。

ifo*_*o20 7

要修复 ES 查询本身,您需要做的就是使用“应该”而不是“必须”:

{
  'query': {
    'bool': {
      'should': [
        {
          'match': {
            'adhar_number': '123456789012'
          }
        },
        {
          'match': {
            'pan_number': 'BGPPG4315B'
          }
        }
      ]
    }
  }
}
Run Code Online (Sandbox Code Playgroud)

要在 python 中实现这一点,请参阅文档中的以下示例。默认逻辑是 AND,但您可以将其覆盖为 OR,如下所示。

查询组合查询对象可以使用逻辑运算符进行组合:

Q("match", title='python') | Q("match", title='django')
# {"bool": {"should": [...]}}

Q("match", title='python') & Q("match", title='django')
# {"bool": {"must": [...]}}

~Q("match", title="python")
# {"bool": {"must_not": [...]}} 
Run Code Online (Sandbox Code Playgroud)

当您多次调用 .query() 方法时,& 运算符将在内部使用:

s = s.query().query() print(s.to_dict())
# {"query": {"bool": {...}}}
Run Code Online (Sandbox Code Playgroud)

如果你想对查询形式有精确的控制,可以使用Q快捷键直接构造组合查询:

q = Q('bool',
    must=[Q('match', title='python')],
    should=[Q(...), Q(...)],
    minimum_should_match=1 ) s = Search().query(q)
Run Code Online (Sandbox Code Playgroud)

所以你想要类似的东西

q = Q('bool', should=[Q('match', **{key:value})])
Run Code Online (Sandbox Code Playgroud)