MongDB-高级

No1：

聚合

聚合(aggregate)主要用于计算数据，类似sql中的sum()、avg()

---语法

db.集合名称.aggregate([{管道:{表达式}}])

No2：

管道

管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的输入

ps ajx | grep mongo

在mongodb中，管道具有同样的作用，文档处理完毕后，通过管道进行下一次处理
常用管道
- $group：将集合中的文档分组，可用于统计结果
- $match：过滤数据，只输出符合条件的文档
- $project：修改输入文档的结构，如重命名、增加、删除字段、创建计算结果
- $sort：将输入文档排序后输出
- $limit：限制聚合管道返回的文档数
- $skip：跳过指定数量的文档，并返回余下的文档
- $unwind：将数组类型的字段进行拆分

No3：

表达式

处理输入文档并输出

---语法

表达式:'$列名'

常用表达式

$sum：计算总和，$sum:1同count表示计数
$avg：计算平均值
$min：获取最小值
$max：获取最大值
$push：在结果文档中插入值到一个数组中
$first：根据资源文档的排序获取第一个文档数据
$last：根据资源文档的排序获取最后一个文档数据

No4：

$group

将集合中的文档分组，可用于统计结果
_id表示分组的依据，使用某个字段的格式为'$字段'

---例1：统计男生、女生的总人数

db.stu.aggregate([

    {$group:

        {

            _id:'$gender',

            counter:{$sum:1}

        }

    }

])

Group by null

将集合中所有文档分为一组

---例2：求学生总人数、平均年龄

db.stu.aggregate([

    {$group:

        {

            _id:null,

            counter:{$sum:1},

            avgAge:{$avg:'$age'}

        }

    }

])

透视数据

---例3：统计学生性别及学生姓名

db.stu.aggregate([

    {$group:

        {

            _id:'$gender',

            name:{$push:'$name'}

        }

    }

])

使用$$ROOT可以将文档内容加入到结果集的数组中

db.stu.aggregate([

    {$group:

        {

            _id:'$gender',

            name:{$push:'$$ROOT'}

        }

    }

])

No5：

$match

用于过滤数据，只输出符合条件的文档
使用MongoDB的标准查询操作

---例1：查询年龄大于20的学生

db.stu.aggregate([

    {$match:{age:{$gt:20}}}

])

---例2：查询年龄大于20的男生、女生人数

db.stu.aggregate([

    {$match:{age:{$gt:20}}},

    {$group:{_id:'$gender',counter:{$sum:1}}}

])

No6:

$project

修改输入文档的结构，如重命名、增加、删除字段、创建计算结果

---例1：查询学生的姓名、年龄

db.stu.aggregate([

    {$project:{_id:0,name:1,age:1}}

])

---例2：查询男生、女生人数，输出人数

db.stu.aggregate([

    {$group:{_id:'$gender',counter:{$sum:1}}},

    {$project:{_id:0,counter:1}}

])

No7：

$sort

将输入文档排序后输出

---例1：查询学生信息，按年龄升序

b.stu.aggregate([{$sort:{age:1}}])

---例2：查询男生、女生人数，按人数降序

db.stu.aggregate([

    {$group:{_id:'$gender',counter:{$sum:1}}},

    {$sort:{counter:-1}}

])

No8:

$limit

限制聚合管道返回的文档数

---例1：查询2条学生信息

db.stu.aggregate([{$limit:2}])

No9:

$skip

跳过指定数量的文档，并返回余下的文档

---例2：查询从第3条开始的学生信息

db.stu.aggregate([{$skip:2}])

---例3：统计男生、女生人数，按人数升序，取第二条数据

db.stu.aggregate([

    {$group:{_id:'$gender',counter:{$sum:1}}},

    {$sort:{counter:1}},

    {$skip:1},

    {$limit:1}

])

注意顺序：先写skip，再写limit

No10:

$unwind

将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值

---语法1

-对某字段值进行拆分

db.集合名称.aggregate([{$unwind:'$字段名称'}])

-构造数据

db.t2.insert({_id:1,item:'t-shirt',size:['S','M','L']})

-查询

db.t2.aggregate([{$unwind:'$size'}])

---语法2

-对某字段值进行拆分

-处理空数组、非数组、无字段、null情况

db.inventory.aggregate([{

    $unwind:{

        path:'$字段名称',

        preserveNullAndEmptyArrays:<boolean>#防止数据丢失

    }

}])

-构造数据

db.t3.insert([

{ "_id" : 1, "item" : "a", "size": [ "S", "M", "L"] },

{ "_id" : 2, "item" : "b", "size" : [ ] },

{ "_id" : 3, "item" : "c", "size": "M" },

{ "_id" : 4, "item" : "d" },

{ "_id" : 5, "item" : "e", "size" : null }

])

----使用语法1查询

db.t3.aggregate([{$unwind:'$size'}])

----查看查询结果，发现对于空数组、无字段、null的文档，都被丢弃了

----问：如何能不丢弃呢？

----答：使用语法2查询

db.t3.aggregate([{$unwind:{path:'$sizes',preserveNullAndEmptyArrays:true}}])

No11：

为了更安全的访问mongodb，需要访问者提供用户名和密码，于是需要在mongodb中创建用户
采用了角色-用户-数据库的安全管理方式
常用系统角色如下：
- root：只在admin数据库中可用，超级账号，超级权限
- Read：允许用户读取指定数据库
- readWrite：允许用户读写指定数据库
创建超级管理用户

use admin

db.createUser({

    user:'admin',

    pwd:'',

    roles:[{role:'root',db:'admin'}]

})

No12：

普通用户管理

---查看当前数据库的用户

use test1

show users

---创建普通用户

db.createUser({

    user:'t1',

    pwd:'',

    roles:[{role:'readWrite',db:'test1'}]

})

---修改用户：可以修改pwd、roles属性

db.updateUser('t1',{pwd:''})

No13：

副本集（复制）

什么是复制

复制提供了数据的冗余备份，并在多个服务器上存储数据副本，提高了数据的可用性，并可以保证数据的安全性
复制还允许从硬件故障和服务中断中恢复数据

为什么要复制

数据备份
数据灾难恢复
读写分离
高（24* 7）数据可用性
无宕机维护
副本集对应用程序是透明

复制的工作原理

复制至少需要两个节点A、B...
A是主节点，负责处理客户端请求
其余的都是从节点，负责复制主节点上的数据
节点常见的搭配方式为：一主一从、一主多从
主节点记录在其上的所有操作，从节点定期轮询主节点获取这些操作，然后对自己的数据副本执行这些操作，从而保证从节点的数据与主节点一致
主节点与从节点进行数据交互保障数据的一致性

复制的特点

N 个节点的集群
任何节点可作为主节点
所有写入操作都在主节点上
自动故障转移
自动恢复

No14：

分片

在Mongodb里面存在另一种集群，就是分片技术,可以满足MongoDB数据量大量增长的需求
当MongoDB存储海量的数据时，一台机器可能不足以存储数据，也可能不足以提供可接受的读写吞吐量，这时，我们就可以通过在多台机器上分割数据，使得数据库系统能存储和处理更多的数据

为什么使用分片

本地磁盘不够大
当请求量巨大时会出现内存不足。
垂直扩展价格昂贵(内存、磁盘、cpu)

No15：

与python交互

# coding=utf-8

from pymongo import *

# 获得客户端，建立连接

client = MongoClient('mongodb://py3:123@localhost:27017/py3')

# 切换数据库

db = client.py3

# 获取集合

stu = db.stu

# 增加

stu.insert_one({'name': '张三'})

# 修改

stu.update_one({'name': '张三'}, {'$set': {'name': 'abc'}})

# 删除

stu.delete_one({'name': 'abc'})

# 查询

cursor = stu.find({'age': {'$gt': 20}}).sort('_id', DESCENDING).skip(1).limit(1)

for s in cursor:

    print(s['name'])

以上是高级部分，本来还有一些是服务器的部署之类，就没放出来了

MongDB-高级的更多相关文章

mongdb高级操作（group by ）
首先介绍哈方法 /** * 利用java驱动自带函数分组查询 * @param key 用来分组文档的字段 [group by key] * @param cond 执行过滤的条件 [where na ...
MongoDB高级查询详细
前言前几篇,老玩家绕道即可,新手晚上闲着也是蛋疼,不如把命令敲一边,这样你就会对MongoDB有一定的掌握啦.如果没有安装MongoDB去看我的上一篇博客 MongoDB下载安装与简单增删改查前 ...
mongodb高级查询
前几篇,老玩家绕道即可,新手晚上闲着也是蛋疼,不如把命令敲一边,这样你就会对MongoDB有一定的掌握啦.如果没有安装MongoDB去看我的上一篇博客 MongoDB下载安装与简单增删改查前奏:启 ...
MongDB篇，第三章：数据库知识3
MongDB 数据库知识3 修改器 $inc 对某个域的值进行加减修改 $mul 对某个域的值进行乘法修改 $min 如果筛选的文档指定的值小于min则不修改,如果大于min 给定的值则修改为m ...
MongoDB的高级使用
MongoDB的高级使用 1. Mongdb的索引备份以及和python交互 t255为mongodb中的集合 1.1 创建索引索引的特点:提高查找的效率不创建索引的情况下的查询: for(i=0 ...
MySQL高级知识- MySQL的架构介绍
[TOC] 1.MySQL 简介概述 MySQL是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,目前属于Oracle公司. MySQL是一种关联数据库管理系统,将数据保存在不同的表中,而 ...
PayPal高级工程总监：读完这100篇论文就能成大数据高手（附论文下载）
100 open source Big Data architecture papers for data professionals. 读完这100篇论文就能成大数据高手作者白宁超 2016年 ...
马哥linux运维初级+中级+高级视频教程教学视频全套下载(近50G)
马哥linux运维初级+中级+高级视频教程教学视频全套下载(近50G)目录详情:18_02_ssl协议.openssl及创建私有CA18_03_OpenSSH服务及其相关应用09_01_磁盘及文 ...
JS高级前端开发群加群说明及如何晋级
JS高级前端开发群加群说明一.文章背景: 二. 高级群: 三. 加入方式: 四. 说明: 一.文章背景: 去年年初建了几个群,在不经意间火了,一直排在“前端开发”关键字搜索结果第一名.当然取得这 ...
C#高级知识点&(ABP框架理论学习高级篇)——白金版
前言摘要很早以前就有要写ABP高级系列教程的计划了,但是迟迟到现在这个高级理论系列才和大家见面.其实这篇博客很早就着手写了,只是楼主一直写写停停.看看下图,就知道这篇博客的生产日期了,谁知它的出厂日 ...

随机推荐

Confluence 6 使用 WebDAV 客户端来对页面进行操作
下面的部分告诉你如何在不同的系统中来设置原生的 WebDAV 客户端,这个客户端通常显示在你操作系统的文件浏览器中,例如,Windows 的 Windows Explorer 或者 Linux 的 K ...
python之多线程通信
共享变量通信事实上共享变量通信是会造成线程安全的,除非我们对这个共享变量是有足够了解的,如非必要就不要使用共享变量在线程间进行通信 Queue通信理解不深入,暂不写
python之内置模块random(转载）
转载自http://www.cnblogs.com/wcwnina/p/9281334.html random.seed(a=None, version=2) # 初始化伪随机数生成器,若种子a相同, ...
【kafka】celery与kafka的联用问题
背景:一个小应用,用celery下发任务,任务内容为kafka生产一些数据. 问题:使用confluent_kafka模块时,单独启用kafka可以正常生产消息,但是套上celery后,kafka就无 ...
【python】统一转换日期格式dateutil.parser.parse
背景: 我有很多很多的日志数据,每个日志里面都有日期字符串,我需要将其转换为datetime格式. 问题是,这些日志里的字符串格式五花八门,有2017-05-25T05:27:30.313292255 ...
Win#password;;processon #clone;;disassemble;;source find
1.密码学思维导图源地址:https://www.processon.com/view/5a61d825e4b0c090524f5b8b 在这之前给大家分享如何在 processon上搜索公开克隆 ...
饮冰三年-人工智能-linux-03 Linux文件管理（权限管理+归档+压缩）
1:对文件的权限管理 drwxr-xr-x. 最后一个.表示在安全情况下创建的.selinux a: d表示目录:-表示普通文件:l表示快捷方式:b设备文件 b:- 属主的权限 r:读权限:w:写权限 ...
Python入门:求1-2+3-4+5...99的所有数的和
num =1 sum =0 while num <=99: if num % 2 ==1: sum = sum + num num =num +1 print(sum) 2.求1-2+3-4+5 ...
C#动态系统托盘图标
C#动态系统托盘图标利用timer组件定时执行变化. using System; using System.Windows.Forms; namespace DynamicStockIcon { p ...
应用程序池--IIS最大工作进程数
IIS 6.0允许将应用程序池配置成一个Web园(Web Garden).要理解Web园的概念,可以设想这样一种情形:假设有一个IIS 5.0服务器和三个Web网站,每一个Web网站运行着相同的应用程 ...