MongoDB基础教程系列--第九篇 MongoDB 分片
1、分片介绍
分片(sharding)是将数据拆分,将其分散存到不同机器上的过程。MongoDB 支持自动分片,可以使数据库架构对应用程序不可见。对于应用程序来说,好像始终在使用一个单机的 MongoDB 服务器一样,另一方面,MongoDB 自动处理数据在分片上的分布,也更容易添加和删除分片。
请记住:复制是让多台服务器拥有同样的数据副本,每一台服务器都是其他服务器的镜像,而每一个分片都与其他分片拥有不同的数据子集。
通常,分片可以用来:
- 增加可用的内存
- 增加可用的磁盘空间
- 减轻单台服务器的负载
- 处理单个 mongod 服务器无法承受的吞吐量
2、MongoDB 分片集群组成
MongoDB 的分片集群由以下部分组成:
shard:每个分片包含分片数据的一个子集,每个分片可以部署为一个副本集
mongos:作为一个查询路由器,提供客户端应用程序和分片集群之间的接口。
config servers:配置服务器存储群集的元数据和配置信息。MongoDB 3.4 版本开始,配置服务器必须部署一个副本集。
分片集群的配置分为 Production Configuration 和 Development Configuration,一个用于生产环境下的配置,另个用于开发或者测试环境的配置。
2.1、Production Configuration(生产环境配置)
在生产集群(production cluster)中,如果集合数据是冗余的,并且系统配置够用,生产分片集群部署,需满足一下几点:
- 部署配置服务器包含三个成员的副本集(Deploy Config Servers as a 3 member replica set)
- 部署每一个分片可以是三个成员的副本集(Deploy each Shard as a 3 member replica set)
- 部署可以有一个或多个路由(Deploy one or more mongos routers)
结构图如下:

2.2、Development Configuration(开发环境配置)
测试或者开发环境,可以使用最少的组件部署一个分片集群,这些非生产集群包含以下组件:
- 具有一个成员的副本集配置服务器(A replica set config server with one member)
- 至少一个分片作为一个成员的副本集(At least one shard as a single-member replica set)
- 一个 mongos 实例(One mongos instance)
结构图如下:

注意:使用测试集群结构,仅仅用于测试或者开发。
下面用较简单的 Development Configuration 举例说明一下。
3、范例
接下来我们就用范例具体说明一下分片的过程,这里准备三台服务器,分别为 218.245.4.11、218.245.4.12、218.245.4.13。
218.245.4.11 作为配置服务器(config server),在该服务器上创建一个成员的副本集。实际项目中,需要三个成员的副本集。
218.245.4.12 作为分片(shard)服务器,在该服务器上也创建一个成员的副本集。实际项目中,可以创建多个分片,每个分片也可以是副本集。
218.245.4.13 作为 mongos 服务器。实际项目中,可以创建多个 mongos。
3.1 创建配置服务器副本集(Create the Config Server Replica Set)
3.1.1 启动配置服务器副本集中的成员(Start a member of the config server replica set),这里定义副本集名字为“configRep”,需要指定 --configsvr 参数,实际项目中用 --bind_ip 指定具体的IP地址
mongod --port 27017 --bind_ip 218.245.4.11 --configsvr --replSet configRep --dbpath c:\data\db
3.1.2 连接到其中一个配置服务器,用 rs.initiate() 初始化副本集
rs.initiate(
{
_id: "configRep",
configsvr: true,
members: [
{ _id: 0, host : "218.245.4.11:27017" }
]
}
)
3.2 创建 Shard 副本集(Create the Shard Replica Sets)
3.2.1 启动 Shard 服务器副本集中的成员(Start a member of the shard replica set),这里定义副本集名字为“shardRep”,需要指定 --shardsvr 参数。这里可以不用是一个副本集,可以是单台 mongod 服务器。
mongod --port 27017 --bind_ip 218.245.4.12 --shardsvr --replSet shardRep --dbpath c:\data\shard
3.2.2 连接到 Shard 服务器,用 rs.initiate() 初始化副本集
rs.initiate(
{
_id: "shardRep"
members: [
{ _id: 0, host : "218.245.4.12:27017" }
]
}
)
3.3 启动 mongos 实例
mongos --configdb configRep/218.24.5.4.11:27017 --port 27017
MongoDB 3.4 版本中,参数 --configdb 的值必须包含副本集的名称,这也是 MongoDB 3.4 版本为什么配置服务器要部署为副本集的原因。
3.4 给集群添加分片
添加分片的操作,必须在 mongos 下操作,也就是要先连上 mongos。可以用 sh.addShard() 方法添加分片
sh.addShard("shardRep/218.245.4.12:27017")
如果分片不用副本集,可以这样添加分片
sh.addShard("218.245.4.12:27017")
3.5 设置分片存储的数据库
MongoDB 中用 sh.enableSharding() 方法设置需要分片存储的数据库,连上 mongos。
sh.enableSharding("liruihuan")
3.6 设置需要分片的集合
在设置分片集合之前,我们有必要了解一下片键(shard key)的概念。MongoDB是怎么对集合分片的呢?这时候就用到了片键。片键是集合的一个键,MongoDB 根据这个键拆分数据。例如,如果选择基于“name”进行分片,MongoDB 对根据不同名字进行分片:“name1”到“name100”位于第一片,“name101”到“name200”位于第二片,以此类推。
给集合分片,需要用 sh.shardCollection() 方法指定需要分片的集合和片键,下面例子是给 user 集合分片,片键为 name,连上 mongos。
sh.shardCollection("liruihuan.user", { name : 1 } )
注意,如果这个集合包含有数据,在用 shardCollection() 之前,我们必须用 db.collection.createIndex() 方法给片键创建索引。如果这个集合为空,MongoDB 在用 shardCollection() 时会创建索引。
3.7 给 user 集合添加20万条数据
给 user 集合添加20万条数据,看看集合是这么分片的
for(var i = 0; i <200000; i++)
{
db.user.insert({"name":"lrh"+i,"age":18})
}
用 sh.status() 查看分片情况
--- Sharding Status ---
sharding version: {
"_id" : 1,
"minCompatibleVersion" : 5,
"currentVersion" : 6,
"clusterId" : ObjectId("58fcb9e3f6420984b3570e11")
}
shards:
{ "_id" : "shardRep", "host" : "shardRep/218.245.4.12:27017", "state" : 1 }
active mongoses:
"3.4.3" : 1
databases:
{ "_id" : "liruihuan", "primary" : "shardRep", "partitioned" : true }
liruihuan.user
shard key: { "name" : 1 }
unique: false
balancing: true
chunks:
shardRep 3
{ "name" : { "$minKey" : 1 } } -->> { "name" : "liruihuan" } on : shardRep Timestamp(1, 1)
{ "name" : "liruihuan" } -->> { "name" : "lrh7" } on : shardRep Timestamp(1, 2)
{ "name" : "lrh7" } -->> { "name" : { "$maxKey" : 1 } } on : shardRep Timestamp(1, 3)
我们可以看出集合的数据被分到名为 shardRep 副本集的分片上了,我们这里只用了一个分片,大家可以启动多个分片,看看数据是怎么分割的。
业精于勤,荒于嬉;行成于思,毁于随。
如果你觉得这篇文章不错或者对你有所帮助,可以通过右侧【打赏】功能,给予博主一点点鼓励和支持
MongoDB基础教程系列--第九篇 MongoDB 分片的更多相关文章
- MongoDB基础教程系列--第二篇 MongoDB基本操作(一)
1.安装环境 在官网上下载MongoDB的最新版本,根据自身Windows版本下载正确的MongoDB版本.下载后,双击32位或者64位.msi文件,按操作提示安装就可以了. 说明: 32 位版本的 ...
- MongoDB基础教程系列--第一篇 进入MongoDB世界
1.什么是MongoDB MongoDB是跨平台的.一个基于分布式文件存储的数据库.由C++语言编写.用它创建的数据库具备性能高.可用性强.易于扩展等特点.MongoDB将数据存储为一个文档,数据结构 ...
- MongoDB基础教程系列--未完待续
最近对 MongoDB 产生兴趣,在网上找的大部分都是 2.X 版本,由于 2.X 与 3.X 差别还是很大的,所以自己参考官网,写了本系列.MongoDB 的知识还是很多的,本系列会持续更新,本文作 ...
- MongoDB基础教程系列--目录结构
最近对 MongoDB 产生兴趣,在网上找的大部分都是 2.X 版本,由于 2.X 与 3.X 差别还是很大的,所以自己参考官网,写了本系列.MongoDB 的知识还是很多的,本系列会持续更新,本文作 ...
- MongoDB基础教程系列--第三篇 MongoDB基本操作(二)
1.集合操作 1.1.创建集合 MongoDB 用 db.createCollection(name, options) 方法创建集合. 格式 db.createCollection(name, op ...
- MongoDB基础教程系列--第四篇 MongoDB 查询文档
查询文档 查询文档可以用 find() 方法查询全部文档,可以用 findOne() 查询第一个文档,当然还可以根据 条件操作符 和 $type操作符 查询满足条件的文档. find() 和 find ...
- MongoDB基础教程系列--第五篇 MongoDB 映射与限制记录
上一篇提到的 find() 的方法,细心的伙伴会发现查询的结果都是显示了集合中全部的字段,实际应用中,显然是不够用的.那么有没有办法指定特定的字段显示出文档呢?答案是肯定的,MongoDB 中用映射实 ...
- MongoDB基础教程系列--第六篇 MongoDB 索引
使用索引可以大大提高文档的查询效率.如果没有索引,会遍历集合中所有文档,才能找到匹配查询语句的文档.这样遍历集合中整个文档的方式是非常耗时的,特别是处理大数据时,耗时几十秒甚至几分钟都是有可能的. 创 ...
- MongoDB基础教程系列--第七篇 MongoDB 聚合管道
在讲解聚合管道(Aggregation Pipeline)之前,我们先介绍一下 MongoDB 的聚合功能,聚合操作主要用于对数据的批量处理,往往将记录按条件分组以后,然后再进行一系列操作,例如,求最 ...
随机推荐
- Servlet中编码在过滤器中的使用
1.先配置web.xml ->配置过滤器 // filter-class 为写的过滤器类 实现 Filter 接口 <filter> <filter-name>Encod ...
- 1677: [Usaco2005 Jan]Sumsets 求和
1677: [Usaco2005 Jan]Sumsets 求和 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 626 Solved: 348[Submi ...
- MySQL数据库设计总结
规则1:一般情况可以选择MyISAM存储引擎,如果需要事务支持必须使用InnoDB存储引擎. 注意:MyISAM存储引擎 B-tree索引有一个很大的限制:参与一个索引的所有字段的长度之和不能超过10 ...
- Visual Studio 2015/2017 与ASP.NET CORE 联合创建具有SPA模式的Angular2模板
虽然注册博客园很久,但是一直没有什么可写的,真心感觉好尴尬了,这次终于找到了一点可以写,有点小兴奋和小害羞呢. 进入主题,前端SPA模式越来越受到欢迎,Core 也开始被很多企业提上日程,但是因为这个 ...
- 【转】nginx配置:location配置方法及实例详解
location匹配的是nginx的哪个变量? $request_uri location的匹配种类有哪些? 格式 location [ 空格 | = | ~ | ~* | !~ | !~* ] /u ...
- web CSS的知识- 关于后代选择器,子选择器,兄弟选择器的使用
1. 后代选择器官方解释:后代选择器可以选择作为某元素后代的元素.理解:选择某一标签的后代中,所有的此标签标记例:ul em {color:red;}就是选择,h1标签后代中中,所有的em.代码如下: ...
- centos6.7编译安装mysql5.7.17
centos6.7编译安装mysql5.7.17 2017-03-24 09:57:15 提示:mysql5.7.17和之前5.56以前的版本安装不一样,需要用cmake 另外,看本文档的mysql编 ...
- 一步到位Linux中安装配置MySQL及补坑
Windows上安装MySQL也就不讲了,基本上一路点击下一步就可完成,现在讲讲Linux上布署Mysql,虽然也有很多网友列出了详细的步骤,可能是因为版本过老的问题导致即使按照上面一步步来也还是出现 ...
- Web前端面试指导(十四):如何居中一个元素(正常、绝对定位、浮动元素)?
题目点评 这道题目的提问比较多,连续问了三个问题,正常元素.绝对定位元素.互动元素如何居中,而且居中没有说清楚是垂直居中还是水平居中,要回答清楚这个问题,必须得有深厚的功底,而且要分类的来回答,条理要 ...
- [SinGuLaRiTy] 最短路计算代码库
[SinGuLaRiTy-1002] Copyright (c) SinGuLaRiTy 2017. All Rights Reserved. Dijkstra: 题目描述 有向图的单源点最短路问题( ...