ES 父子文档查询

父子文档的特点

1. 父/子文档是完全独立的。

2. 父文档更新不会影响子文档。

3. 子文档更新不会影响父文档或者其它子文档。

父子文档的映射与索引

1. 父子关系 type 的建立必须在索引新建或 update-mapping 时候确定好

PUT /company

{

  "mappings": {

    "branch": {},             //父文档 type

    "employee": {

      "_parent": {

        "type": "branch"      //子文档 type

      }

    }

  }

}

2. 父文档的索引和普通文档索引一样。

POST /company/branch/_bulk

{ "index": { "_id": "london" }}

{ "name": "London Westminster", "city": "London", "country": "UK" }

3. 子文档索引必须指定其对应的父文档 ID，作用：

建立父子文档之间的关联
确保子文档能够被索引到父文档所在分片（parent id 作为 route）

PUT /company/employee/?parent=london     //指定 id = london 的父文档

{

  "name":  "Alice Smith",

  "dob":   "1970-10-24",

  "hobby": "hiking"

}

4. 如果要更改文档的父文档，不能仅仅 update 或者 reindex 旧文档（新的父文档可能在不同分片上），需要先删除旧文档再重新索引。

父子关系的应用

看到 parent-child 关系，我们很容易想到的是像 SQL 那样的各种 JOIN 操作——比如查询某个文档并一并取回所有的父或子文档等。

然而，ES 中不支持类似的 JOIN 查询。即便 child aggregation 也不能做到像 SQL 那样的 JOIN 操作！

在 ES 中的 parent-child 关系基本可以理解为是一个过滤条件，如下：

//查询某文档，只有该文档有"父文档"且满足一定条件才算匹配

{"has_parent": {                //文档是否有 parent

      "type": "branch",         //其 parent 所在 type 必须是 branch

      "query": {                //其 parent 必须满足以下 query 条件

        "match": {

          "country": "UK"

        }

      }

    }                           //如果满足以上条件，hit 该文档

}

//查询某文档，只有该文档有"子文档"且满足一定条件才算匹配

{

"has_child": {                       //文档是否有 child

      "type":       "employee",      //其 child所在 type 必须是 employee

      "query": {                     //其 parent 必须满足以下 query 条件

        "match": {

          "name": "Alice Smith"

        }

      }

    }                                //如果满足以上条件，hit 该文档

}

1. has_child：基于子文档的内容，查找父文档

//请求 GET /company/branch/_search

{

  "query": {

    "has_child": {                                //基于 child 的内容，查询满足条件的 parent 文档

      "type":       "employee",

      "query": {                                   //在 child 中执行 match query操作

        "match": {

          "name": "Alice Smith"

        }

      }

    }

  }

}

//结果

{

  "took": ,

  "timed_out": false,

  "_shards": {

    "total": ,

    "successful": ,

    "failed":

  },

  "hits": {

    "total": ,

    "max_score": ,

    "hits": [

      {

        "_index": "company",

        "_type": "branch",                     //注意！！！返回的是 parent 的文档

        "_id": "london",

        "_score": ,

        "_source": {

          "name": "London Westminster",

          "city": "London",

          "country": "UK"

        }

      }

    ]

  }

}

2. has_parent：基于父文档的内容，查找子文档

//请求 GET /company/employee/_search

{

  "query": {

    "has_parent": {                       //基于 parent 的内容，查询满足条件的 child 文档

      "type": "branch",

      "query": {                             //在 parent 中执行 match query 查询

        "match": {

          "country": "UK"

        }

      }

    }

  }

}

//结果

{

  "took": ,

  "timed_out": false,

  "_shards": {

    "total": ,

    "successful": ,

    "failed":

  },

  "hits": {

    "total": ,

    "max_score": ,

    "hits": [

      {

        "_index": "company",

        "_type": "employee",              //注意！！！返回的是 child 的文档

        "_id": "",

        "_score": ,

        "_routing": "london",

        "_parent": "london",

        "_source": {

          "name": "Alice Smith",

          "dob": "1970-10-24",

          "hobby": "hiking"

        }

      }

    ]

  }

}

3. children aggregation：对关联的 child 文档进行聚合操作

//请求 GET /company/branch/_search

{

  "size" : ,

  "aggs": {

    "country": {

      "terms": {

        "field": "country"                        //以不同的 country 来分组（桶分）

      },

      "aggs": {

        "employees": {

          "children": {                           //children aggregation，子 type 为 employee

            "type": "employee"

          },

          "aggs": {

            "hobby": {

              "terms": {

                "field": "hobby"                  //以不同的 hobby 来分组（桶分）

              }

            }

          }

        }

      }

    }

  }

}

//结果

"aggregations": {

   "country": {

      "doc_count_error_upper_bound": ,

      "sum_other_doc_count": ,

      "buckets": [                                                //country 聚合结果

        {

          "key": "uk",

          "doc_count": ,

          "employees": {                                          //children aggregation 聚合

            "doc_count": ,

            "hobby": {

              "doc_count_error_upper_bound": ,

              "sum_other_doc_count": ,

              "buckets": [                                       //hobby 聚合结果

                {

                  "key": "hiking",

                  "doc_count":

                }

              ]

            }

          }

        }

      ]

    }

}

ES 父子文档查询的更多相关文章

ElasticSearch 6.x 父子文档[join]分析
ES6.0以后,索引的type只能有一个,使得父子结构变的不那么清晰,毕竟对于java开发者来说,index->db,type->table的结构比较容易理解. 按照官方的说明,之前一个索 ...
elasticsearch父子文档处理(join)
elasticsearch父子文档处理 join 一.背景二.需求三.前置知识四.实现步骤 1.创建 mapping 2.添加父文档数据 3.添加子文档 4.查询文档 1.根据父文档id查询它下 ...
015-elasticsearch5.4.3【五】-搜索API【四】Joining 多文档查询、GEO查询、moreLikeThisQuery、script脚本查询、span跨度查询
一.Joining 多文档查询 joining query 像Elasticsearch这样的分布式系统中执行完整的SQL样式连接非常昂贵.相反,Elasticsearch提供两种形式的连接,旨在水平 ...
elasticsearch 父子文档(十一)
说明需求一个产品多个区域销售每个区域有自己的价格, 方式1冗余行,a 产品分别在 area1 area2 area3区域销售 a产品就会生成3条产品数据搜索id去重就行了,但是问题就是聚合 ...
Elasticsearch必知必会的干货知识一：ES索引文档的CRUD
若在传统DBMS 关系型数据库中查询海量数据,特别是模糊查询,一般我们都是使用like %查询的值%,但这样会导致无法应用索引,从而形成全表扫描效率低下,即使是在有索引的字段精确值查找,面对海量数 ...
Elasticsearch增删改查之 —— mget多文档查询
之前说过了针对单一文档的增删改查,基本也算是达到了一个基本数据库的功能.本篇主要描述的是多文档的查询,通过这个查询语法,可以根据多个文档的查询条件,返回多个文档集合. 更多内容可以参考我整理的ELK文 ...
Elasticsearch文档查询
简单数据集到目前为止,已经了解了基本知识,现在我们尝试用更逼真的数据集,这儿已经准备好了一份虚构的JSON,关于客户银行账户信息的.每个文档的结构如下: { , , "firstname& ...
SpringMVC MongoDB之“基本文档查询（Query、BasicQuery）”
一．简介 spring Data MongoDB提供了org.springframework.data.mongodb.core.MongoTemplate对MongoDB的CRUD的操作,上一篇我 ...
Spring Data MongoDB 三：基本文档查询（Query、BasicQuery）（一）
一．简单介绍 Spring Data MongoDB提供了org.springframework.data.mongodb.core.MongoTemplate对MongoDB的CRUD的操作,上一 ...

随机推荐

解开发者之痛：中国移动MySQL数据库优化最佳实践(转)
开源数据库MySQL比较容易碰到性能瓶颈,为此经常需要对MySQL数据库进行优化,而MySQL数据库优化需要运维DBA与相关开发共同参与,其中MySQL参数及服务器配置优化主要由运维DBA完成,开发则 ...
HDU1518 Square
#include<stdio.h> #include<string.h> #include<math.h> #include<stdlib.h> #de ...
jquery easyui的layout
1.创建一个布局:layout是一个容器,它有5个区域:north(北),south(南),east(东),west(西):center(中)-----------学习中文网地址 <body c ...
POJ 1979 dfs和bfs两种解法
fengyun@fengyun-server:~/learn/acm/poj$ cat 1979.cpp #include<cstdio> #include<iostream&g ...
SCOM2007R2安装和报表服务器配置
SCOM2007R2默认安装不可以直接支持SQL Server2008R2,需要SQL Server 2008SP1. 如果数据库安装在另一台计算机上,则在安装了SQL Server的计算机上先运行S ...
批量下载QQ空间日志
从手机页面读取,有时候也会卡死,解决办法还是重新来……………… # -*-coding:utf-8-*- # 作者:fwindpeak # import urllib import urllib2 i ...
Swift学习笔记六
集合类型(Collection Type) Swift提供三种主要的集合类型:数组(array).集合(set).字典(dictionary).数组是有序的值序列,集合是无序的值序列,字典是无序的键值 ...
TC SRM 665 DIV2 A LuckyXor 暴力
LuckyXorTime Limit: 20 Sec Memory Limit: 256 MB 题目连接 TC Description A lucky number is a positive int ...
WPF基础到企业应用系列7——深入剖析依赖属性（WPF/Silverlight核心）
一. 摘要首先圣殿骑士非常高兴这个系列能得到大家的关注和支持.这个系列从七月份開始到如今才第七篇,上一篇公布是在8月2日,掐指一算有二十多天没有继续更新了,最主要原因一来是想把它写好,二来是由于近期 ...
python手记(50)
#!/usr/bin/env python # -*- coding: utf-8 -*- #http://blog.csdn.net/myhaspl #code:myhaspl@qq.com imp ...