ElasticSearch:查询作为对象数组的字段

hel*_*ump 5 c# json elasticsearch

我使用 ElasticSearch 对数据进行了索引,但在查询特定字段时遇到问题。JSON 片段如下:

 {
 "_index": "indexName",
 "_type": "type",
 "_id": "00001",
 "color": "red",
 "place": "london",
 "person": [
      {
           "name": "john",
           "friends": [
               "mary",
               "jane"
           ]
      }
      {
           "name": "jack",
           "friends": [
               "lisa",
               "alex"
           ]
      }

 ]
 }
Run Code Online (Sandbox Code Playgroud)

我需要查询索引并挑选出其中names之一person是“john”的所有记录。

我正在Client.Search这样做,并且使用以下方法查询未嵌套的字段(如color)没有任何问题:

 var searchResults = client.Search<People>(s => s
            .Index("indexName")
            .Type("type")
            .Query(q => q
                .Bool(b => b
                    .Must(
                        x => x.Match(m => m.OnField(p => p.color).Query("red")),
                        x => x.Match(m => m.OnField(p => p.place).Query("london"))))));
Run Code Online (Sandbox Code Playgroud)

我的People定义如下:

public class People
{
    public string color {get; set; }
    public string place {get; set; }
    public List<Person> person {get; set; }
}
public class Person
{
    public string name {get; set; }
    // "friends" isn't here as I don't pull data from it
}
Run Code Online (Sandbox Code Playgroud)

我不确定如何查询,name因为它在“内部” people- 非常感谢任何帮助。

sla*_*wek 6

您需要将查询包装起来nested_query才能访问嵌套字段。

{
    "nested" : {
        "path" : "person",
        "query" : {
             "match" : {"person.name" : "john"}
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

文档摘录:

查询是针对嵌套对象/文档执行的,就好像它们被索引为单独的文档(它们是,内部)并导致根父文档(或父嵌套映射)。

基本上内部嵌套的字段作为单独的文档存储在原始文档附近(因此它们可以快速获取)。默认情况下,elastic 不会加载它们,因此您需要明确告诉他您要访问它。你可以说嵌套字段是懒惰的 ;)

抱歉,我已经很久没有在 .Net 和 Linq 上工作了。不知道API。但是您需要创建类似的东西。

编辑。 从 github源代码和您的代码,我认为您需要:

var s = new SearchDescriptor<People>()
                .Query(ff=>ff
                    .Nested(n=>n
                        .Path(f=>f.person[0])
                        .Query(q=>q.Term(f=>f.person[0].name,"john"))
                    )
                );
Run Code Online (Sandbox Code Playgroud)

编辑2。 您是否尝试直接 curl 到服务器?或者尝试在 head 插件中查询?就像是:

curl -XPOST 'http://localhost:9202/indexName' -d '
{
  "query": {
    "nested": {
      "path": "person",
      "query": {
        "query_string": {
          "query": "person.name: john"
        }
      }
    }
  }
}'
Run Code Online (Sandbox Code Playgroud)

这适用于我的集群(更改了列名)。


hel*_*ump 4

过了很长一段时间,我终于发现我的数据实际上并没有像嵌套一样被索引,所以只需添加

.Term("person.name", "john")
Run Code Online (Sandbox Code Playgroud)

我的查询工作得很好。