如何在 ElasticSearch 中寻址、删除或访问子对象？

Question

如何在 ElasticSearch 中寻址、删除或访问子对象？

在 elasticseacrch 中如何处理子对象？

假设我们创建了两个父母和三个孩子。请注意，有两个孩子有 idc2但父母不同：

curl -XPUT localhost:9200/test/parent/p1 -d'{
  "name": "Parent 1"
}'

curl -XPUT localhost:9200/test/parent/p2 -d'{
  "name": "Parent 2"
}'

curl -XPOST localhost:9200/test/child/_mapping -d '{
  "child":{
    "_parent": {"type": "parent"}
  }
}'

curl -XPOST localhost:9200/test/child/c1?parent=p1 -d '{
   "child": "Parent 1 - Child 1"
}'

curl -XPOST localhost:9200/test/child/c2?parent=p1 -d '{
   "child": "Parent 1 - Child 2"
}'

curl -XPOST localhost:9200/test/child/c2?parent=p2 -d '{
   "child": "Parent 2 - Child 2"
}'

Run Code Online (Sandbox Code Playgroud)

如果我们寻找孩子，我们看到有两个孩子_id的c2

curl -XGET localhost:9200/test/_search

{
  "_shards": {
    "failed": 0, 
    "successful": 5, 
    "total": 5
  }, 
  "hits": {
    "hits": [
      {
        "_id": "c1", 
        "_index": "test", 
        "_score": 1.0, 
        "_source": {
          "child": "Parent 1 - Child 1"
        }, 
        "_type": "child"
      }, 
      {
        "_id": "c2", 
        "_index": "test", 
        "_score": 1.0, 
        "_source": {
          "child": "Parent 1 - Child 2"
        }, 
        "_type": "child"
      }, 
      {
        "_id": "c2", 
        "_index": "test", 
        "_score": 1.0, 
        "_source": {
          "child": "Parent 2 - Child 2"
        }, 
        "_type": "child"
      }
    ], 
    "max_score": 1.0, 
    "total": 3
  }, 
  "timed_out": false, 
  "took": 1
}

Run Code Online (Sandbox Code Playgroud)

我该如何解决p1/c2？在没有父子关系的情况下，_id可以使用访问、更改或删除子对象。就我而言，我让 elasticsearch 创建id对象的。

要访问子对象，_id还不够：

curl -XGET localhost:9200/test/child/c2

Run Code Online (Sandbox Code Playgroud)

我还必须指定父级：

curl -XGET localhost:9200/test/child/c2?parent=p1

Run Code Online (Sandbox Code Playgroud)

在我的系统中，情况更糟，我可以直接访问某些对象而无需访问parent其他对象。（为什么？？？）

如果我删除 c2（没有父级！）：

curl -XDELETE http://localhost:9200/test/child/c2

Run Code Online (Sandbox Code Playgroud)

两个孩子都被删除了。要仅删除一个孩子，我必须使用?parent=p1

curl -XDELETE http://localhost:9200/test/child/c2?parent=p1

Run Code Online (Sandbox Code Playgroud)

这是我的问题。

管理子对象身份的最佳实践是什么？
这是否意味着，我必须以某种方式将父 id 手动放入子对象中，然后将对象构造为 id?parent=parent_id
为什么elasticsearch不返回父ID？
如果我让 elasticseach 创建子对象的 id，它们是否保证是唯一的，或者不同父母的两个孩子会得到相同的 idid吗？

Answer 1

Rot*_*mon 5

子文档只是 Elasticsearch 中的普通文档，附加了一个 _parent 字段，指向父类型的文档。
在访问子文档时，无论是在索引时还是在获取时，都需要在请求中指定父 id。这是因为父 id 实际上用于子文档的路由（参见关于路由的例子 - http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/search.html#search-routing） .
这意味着子文档根据父id 进行分片，因此它与父文档驻留在同一个分片上。

在您上面的示例中，可能发生的情况是您的每个 c2 文档都是在一个单独的分片上创建的 - 一个由其自己的 id 分片，另一个（您指定父级的位置）根据父 id 进行分片。

理解这一点很重要，这样您就不会在索引、获取和搜索之间出现不一致。因此，您需要记住在处理子文档时始终传递父文档，以便将它们路由到正确的分片。

关于文档 ID - 您需要像对待所有其他文档一样对待它。这意味着它必须是唯一的，即使它们有不同的父级，也不能有 2 个具有相同 ID 的文档。
您可以使用父 id 作为子文档 id 的一部分（如您所建议的），或者如果在您的用例中有意义的话，让 ES 生成一个唯一的 id。ES 生成的文档 ID 是唯一的，无论父级如何。

关于取回父字段，需要明确请求，默认不返回。（使用 fields 参数请求它 - http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/docs-get.html#get-fields，或在搜索中 - https://www.elastic。 co/guide/en/elasticsearch/reference/current/search-request-stored-fields.html）。

归档时间：	12 年，2 月前
查看次数：	2975 次
最近记录：	7 年，2 月前