前言

MongoDB 推荐使用「内嵌文档(Embedded)」,所以带来一个问题,如何查询嵌入文档内的数据?

假如我们有一个 storage 的 Collection,包含一条数据:

// `storage` Collection
{
"_id": "alpha",
"name": "Storage Alpha",
"items": [
{
"category": "food",
"name": "apple"
},
{
"category": "food",
"name": "banana"
},
{
"category": "tool",
"name": "hammer"
},
{
"category": "furniture",
"name": "couch"
}
]
}

如何查出 items.categoryfood 的数据?

熟悉 MongoDB 查询语句的同学可能立刻想到了以下查询语句:

db.storage.find({
'items.category': {
$eq: 'food'
}
})

但是这样只能查出这一条 storage 数据,并不能过滤 items 字段中不符合条件数据,实时上就是返回了整个 document。

解决方案

$ 映射操作符(Projection Operator)

第一个解决方案是使用 $ 映射操作符。

这是 官方文档 的介绍:

$ 操作符会限制 array 类型数据的返回结果,使其仅返回第一个满足条件的元素。

那么我们使用 $ 进行查询:

db.storage.find(
{
'items.category': {
$eq: 'food'
}
},
{
'items.$': 1
}
)

就会得到这样的结果:

{
"_id" : "alpha",
"items" : [
{
"category" : "food",
"name" : "apple"
}
]
}

可以看到,不符合条件的 items 确实没有返回了(_id 字段是默认会返回的),但因为 $ 映射操作符只会返回数组中第一个符合条件的元素,另一条同样符合条件的元素无法被获取到。

$ 映射操作符还有一些其他限制条件

$elemMatch 映射操作符(Projection Operator)

另一种方式是使用 $elemMatch 操作符(官方文档)。

同样是「映射操作符」,$elemMatch$ 的区别在于,$ 使用的是数据查询条件作为来映射(或者说过滤)array 中的数据,而 $elemMatch 需要指定单独的条件(可以指定多个条件)。

查询示例如下:

db.storage.find(
// 对 `items` 的过滤条件不需要写在查询条件中
{
'_id': "alpha"
},
{
'items': {
'$elemMatch': {
'category': 'food'
}
}
}
)

查询结果:

{
"_id" : "alpha",
"items" : [
{
"category" : "food",
"name" : "apple"
}
]
}

但和 $ 一样,$elemMatch 也只能返回数组中的第一条元素。

聚合(Aggregation)

MongoDB >= 3.2

$filter

「聚合」这里我们就简单理解为对数据的批处理(分组、转换、统计等)。它的功能实际上太强大了,详细介绍还是推荐看官方文档,用它来做数组过滤其实有一些杀鸡用牛刀的感觉。

查询语句看起来有一些复杂:

db.storage.aggregate(
{
$project: {
"items": {
$filter: {
input: "$items",
as: "item",
cond: {
$eq: [ '$$item.category', 'food' ]
}
}
}
}
}
)

查询结果:

{
"_id" : "alpha",
"items" : [
{
"category" : "food",
"name" : "apple"
},
{
"category" : "food",
"name" : "banana"
}
]
}

终于我们得到了想要的结果!

$unwind

同样使用「聚合」,还可以使用 $unwind 操作符

如果文档中包含 array 类型字段、并且其中包含多个元素,使用 $unwind 操作符会根据元素数量输出多个文档,每个文档的 array 字段中仅包含 array 中的单个元素。

我们来试试看:

db.storage.aggregate(
{
$match : {
'items.category': 'food'
}
},
{
$unwind : '$items'
},
{
$match : {
'items.category': 'food'
}
}
)

查询结果:

{
"_id" : "alpha",
"name" : "Storage Alpha",
"items" : {
"category" : "food",
"name" : "apple"
}
} {
"_id" : "alpha",
"name" : "Storage Alpha",
"items" : {
"category" : "food",
"name" : "banana"
}
}

$unwind 操作符返回了多条文档数据,并且改变了 items 字段的类型。

不过查询语句相对前一个例子来说要简洁和易于理解,在某些场景下可能更好用。

应用层过滤处理

如题,如果数组内容不多,取出整个文档后在应用层进行处理也不失为一个方法,可以说是分布式计算了……

结语

最近发现文章被盗链非常严重,甚至在百度的权重都超过了出处…在此插入简书地址:https://www.jianshu.com/u/11c0ebe856b8

总结一下目前的结论(当前 MongoDB 版本为 3.6):

  • 如果只需要获取 array 字段中的第一个满足条件的元素、并且一次查询中仅操作一个 array 类型的字段,使用 $ 或者 $elemMatch 映射操作符都可以满足需求;
  • 其他情况,优先考虑使用「聚合」;
  • 没有强迫症也可以在应用层做过滤处理。

这个结论让我也颇感意外,因为「内嵌式」建模方式是 MongoDB 官方宣传的亮点之一(官方文档,当年的宣传文档我暂时没找到)。如果你有更好的方案请在评论中指出。

参考资料

原文链接:https://www.jianshu.com/p/b28a73ba9a16

MongoDB 几种查询嵌套数据(Embedded)的方式(转载)的更多相关文章

  1. Hive三种不同的数据导出的方式

    转自:http://blog.chinaunix.net/uid-27177626-id-4653808.html Hive三种不同的数据导出的方式,根据导出的地方不一样,将这些方法分为三类:(1)导 ...

  2. MySQL提供的几种检索行数据的优化方式

    ICP(Index Condition Pushdown): 在MySQL5.6之前,存储引擎会通过遍历索引定位基表中 的行,然后返回给Server层,再去为这些数据进行WHERE后的条件过滤.MyS ...

  3. android端从服务器抓取的几种常见的数据的处理方式

    1.图片 public void look(View v) { String path = et_path.getText().toString(); try { URL url = new URL( ...

  4. 浅谈Entity Framework中的数据加载方式

    如果你还没有接触过或者根本不了解什么是Entity Framework,那么请看这里http://www.entityframeworktutorial.net/EntityFramework-Arc ...

  5. MongoDB的批量查询条件进行批量更新数据

    今天遇到这样一个场景:在Java中批量更新MongoDB数据,不过每次更新的条件有不一样,那如何有效地进行更新操作呢? 刚开始的时候,我是想到循环批量更新操作,即每一种查询条件进行一次批量更新过程,这 ...

  6. ORACLE 查询一个数据表后通过遍历再插入另一个表中的两种写法

    ORACLE 查询一个数据表后通过遍历再插入另一个表中的两种写法 语法 第一种: 通过使用Oracle语句块  --指定文档所有部门都能查看 declare cursor TABLE_DEPT and ...

  7. Dynamic CRM 2013学习笔记(十)客户端几种查询数据方式比较

    我们经常要在客户端进行数据查询,下面分别比较常用的几种查询方式:XMLHttpRequest, SDK.JQuery, SDK.Rest. XMLHttpRequest是最基本的调用方式,JQuery ...

  8. MySQL查询随机数据的4种方法和性能对比

    从MySQL随机选取数据也是我们最常用的一种发发,其最简单的办法就是使用”ORDER BY RAND()”,本文介绍了包括ORDER BY RAND()的4种获取随机数据的方法,并分析了各自的优缺点. ...

  9. android sqlite使用之模糊查询数据库数据的三种方式

    android应用开发中常常需要记录一下数据,而在查询的时候如何实现模糊查询呢?很少有文章来做这样的介绍,所以这里简单的介绍下三种sqlite的模糊查询方式,直接上代码把: package com.e ...

随机推荐

  1. 查看电脑已保存的wifi及密码

    1. 查看以保存的wifi名称  打开cmd(win+r) #查看已保存WiFi名称 netsh wlan show profiles 2. 查看已保存的wifi的密码 netsh wlan show ...

  2. kafka broker Leader -1引起spark Streaming不能消费的故障解决方法

    一.问题描述:Kafka生产集群中有一台机器cdh-003由于物理故障原因挂掉了,并且系统起不来了,使得线上的spark Streaming实时任务不能正常消费,重启实时任务都不行.查看kafka t ...

  3. Java数组转集合与集合转数组的坑

    在Java中将数组转为集合,会用到Arrays.asList()的方法,然而,这个方法却与我们的预期期望存在一些出入,当用到asList方法将数组转化成List列表时,对得到的List列表进行add( ...

  4. java之maven之初识maven

    1.maven是一个项目管理工具. 包括项目创建.资源管理.项目运行.项目发布等功能. 2.为什么使用 maven? a. jar 依赖管理(升级.降级)等 b. 项目之间依赖管理 c. 资源文件管理 ...

  5. Django---静态文件配置,post提交表单的csrf问题(日后细说),创建app子项目和分析其目录,ORM对象关系映射简介,Django操作orm(重点)

    Django---静态文件配置,post提交表单的csrf问题(日后细说),创建app子项目和分析其目录,ORM对象关系映射简介,Django操作orm(重点) 一丶Django的静态文件配置 #we ...

  6. element-ui 自定义 Upload 上传进度条

    <el-upload class="upload-demo" ref="vidos" :action="URL+'/api/post/file' ...

  7. [JS设计模式]:观察者模式(即发布-订阅者模式)(4)

    简介 观察者模式又叫发布---订阅模式,它定义了对象间的一种一对多的关系,让多个观察者对象同时监听某一个主题对象,当一个对象发生改变时,所有依赖于它的对象都将得到通知. 举一个现实生活中的例子,例如小 ...

  8. BDOC ROUTER

    BAPI_CRM_SAVECRM_GENERIC_CRM_INMAP_BAPIMTCS_AND_PROCESSCRM_DOWNLOAD_MAP_TO_MBDOCCRM_SALESDOC_MAP_BAP ...

  9. redis中获取不同自增数的方法

    项目需求,需要获取不同的自增数,然后与其他信息拼接成一个字符串作为编号,这边有一种基于数据库的获取自增数的方法,这边略过,还有一种基于redis的实现. 此方法可以用到redis的自增函数 publi ...

  10. [ ERROR ] Error in test library 'pymysql': Creating keyword 'Connect' failed: Keyword with same name defined multiple times.

    [ ERROR ] Error in test library 'pymysql': Creating keyword 'Connect' failed: Keyword with same name ...