mongodb集群安装及到现在遇到的一些问题
集群搭建
只有3台服务器,开始搭建mongodb集群里主要参照的是http://www.lanceyan.com/tech/arch/mongodb_shard1.html,端口的设置也是mongos为 20000, config server 为 21000, shard1为 22001 , shard2为22002, shard3为22003。其大体思路为:
在每台服务器上启动config服务
在每台服务器上启动mongos服务,并指定每个mongos服务包含的config服务地址(前一步启动的3个config服务)https://docs.mongodb.com/manual/reference/program/mongos/#cmdoption--configdb
每台服务器上,为每个分片或其复本启动mongod实例https://docs.mongodb.com/manual/tutorial/deploy-replica-set/#start-each-member-of-the-replica-set-with-the-appropriate-options
登录任意一台服务器,配置每个分片的复本集包含的实例https://docs.mongodb.com/manual/reference/method/rs.initiate/#example
登录mongos,在mongos服务中添加启动好的分片https://docs.mongodb.com/manual/reference/command/addShard/#definition
最后在数据库层面和数据集层面开启分片功能。
经过上述几个步骤,就搭出了下图的集群。(图片来自http://www.lanceyan.com/tech/arch/mongodb_shard1.html)

原理、基本命令及参数说明
基本命令
mongod --configsvr 把该mongod实例启动为某个分片集的config Server。这样一来,只能通过admin或config来向数据库写数据¶
mongod --fork 把mongod实例启动为后台进程
mongod --dbpath 指定实例的目录
mongod --logpath 指定实例的日志路径
mongod --shardsrv 把该实例启动为【分片集】的一个【分片】
mongod --replSet 该实例为【复本集】的一个实例
mongod --oplogSize 配置local数据库中oplog.rs集合的大小(单位M)。实例同步时,在多个实例之间进行同步时,oplog.rs集合用来存储数据库的改变。一旦建立该表大小就固定了,填满后如果又来了新的更改,后来的修改就覆盖前面的。由于在装集群时开始设置太小,后面插入操作又特别多,导致多实例同步跟不上oplog.rs表覆写的速度,造成too stale to 更新的错误。后面有更改oplig.rs大小的过程。
mongod --port 指定该实例启动的端口号
mongos mongos是为分片的mogodb集群作为路由服务的,说白了就是来了一个操作,我给你指定你到哪个分片上去执行。
mongos --configdb 指定分片集的config servers
mongos --dbpath 同上
mongos --logpath 同上
mongos --port 同上
mongos --fork 同上
为分片集开启一个配置服务(每台机器一个,如果有损坏,路由服务器可以读取其它配置服务)
mongod --configsvr --dbpath /data/dbmongo/config/data --port --logpath /data/dbmongo/config/log/config.log --fork
为分片集开启路由服务(每台机器一个,如果有损坏,程序可以调其它的路由继续工作)¶
mongos --configdb ip1:,ip2:,ip3: --port --logpath /data/dbmongo/mongos/log/mongos.log --fork
开启每个分片对应的每个mongod数据库实例(每台机器上都有3个数据库实例)¶¶
mongod --shardsvr --replSet shard1 --port --dbpath /data/dbmongo/shard1/data --logpath /data/dbmongo/shard1/log/shard1.log --fork --oplogSize
mongod --shardsvr --replSet shard2 --port --dbpath /data/dbmongo/shard2/data --logpath /data/dbmongo/shard2/log/shard2.log --fork --oplogSize
mongod --shardsvr --replSet shard3 --port --dbpath /data/dbmongo/shard3/data --logpath /data/dbmongo/shard3/log/shard3.log --fork --oplogSize
登录一个mongod数据实例,并初始化副本集¶
mongo 127.0.0.1:
use admin
config = {
_id:"复本名字",
members:[
{_id:,host:"ip1:22001",arbiterOnly:true},
{_id:,host:"ip2:22001"},
{_id:,host:"ip3:22001"}
]
}
rs.initiate(config);
在分片中加入相应的复本集¶
mongo 127.0.0.1:
use admin
db.runCommand( { addshard : "shard1/ip1:22001,ip2:22001,ip3:22001"});
db.runCommand( { addshard : "shard2/ip1:22002,ip2:22002,ip3:22002"});
db.runCommand( { addshard : "shard3/ip1:22003,ip2:22003,ip3:22003"});
开启数据库分片并对集合进行分片¶¶
db.runCommand( { enablesharding :"数据库名"});
db.runCommand( { shardcollection : "数据库名.集合名",key : {_id: } } )
更改oplogSize值
oplogSize是设置的local数据库里的oplog.rs集合的大小,如果启动时oplogSize设置太小,一旦建立就不能再增大了。复本数据库一旦down掉一段时间,主数据库有可能把oplog.rs表填满之后又来了新的修改把表覆盖了,那么复本数据库再启起来就会一直处于Recovering状态,日志里提示too stale to catch up。这个时候可以:
1。把复本数据库全清掉,重新启动复本数据库实例,这样复本数据库会初始把主数据库里的数据全拷贝一遍。
2。把复本数据库全清掉,从主数据库里复制好data放过来并重启。(没试过)
3。在线的修改oplogSize的值,原理就是把数据库关掉后,启动成单实例的模式,然后删掉oplog.rs并重新建一个更大的oplog.rs。这个官方文档里有说明:Change the Size of the Oplog¶
更改步骤
- (可选)对于Primary节点,要降成非Primary节点
rs.stepDown()
- 关闭数据库
use admin
db.shutdownServer() - 启动为独立的数据库实例
mongod --port --dbpath /data/dbmongo/shard2/data --logpath /data/dbmongo/shard2/log/shard2.log --fork
- (可选)备份oplog.rs文件Back Up with mongodump¶
mongodump --db local --collection 'oplog.rs' --port
- 把oplog.rs里最后更新的一条备份出来,新建oplog.rs,并导入备份的这一条。(以后复本集里的不同复本之间相互同步时,要找到本地的最后一次修改(备份的这一条),在其它oplog.rs里找到这一条,更新其之后的修改)
use local
db = db.getSiblingDB('local')
db.temp.drop()
db.temp.save( db.oplog.rs.find( { }, { ts: , h: } ).sort( {$natural : -} ).limit().next() )
db.oplog.rs.drop()
db.runCommand( { create: "oplog.rs", capped: true, siz10 * * * ) } )
db.oplog.rs.save( db.temp.findOne() ) - 关闭数据库并启动为集群的一个分片的复本集的一个复本。
use admin
db.shutdownServer() mongod --shardsvr --replSet shard2 --port --dbpath /data/dbmongo/shard2/data --logpath /data/dbmongo/shard2/log/shard2.log --fork
too many open files错误
这个很有可能是由于unix系统对程序的资源使用限制造成的,具体可以参见文档:UNIX ulimit Settings¶
修改方法为修改/etc/security/limits.d/99-mongodb-nproc.conf
# Default limit for number of user’s processes to prevent
# accidental fork bombs.
# See rhbz # for reasoning.
#
# * soft nproc
# root soft nproc unlimited
* soft nofile
* hard nofile
* soft fsize unlimited
* hard fsize unlimited
* soft cpu unlimited
* hard cpu unlimited
* soft nproc
* hard nproc
另外还有尽量不以root用户开启mongod实例等等,具体修改忘记了,大体是这样
http://www.lanceyan.com/tech/arch/mongodb_shard1.html
http://www.cnblogs.com/wilber2013/p/4154406.html
mongodb集群安装及到现在遇到的一些问题的更多相关文章
- MongoDB集群安装与配置2.4.3版本
mongoDB安装http://www.mongodb.org/downloads拷文件到# cp mongodb-linux-i686-2.4.1.tgz /usr/local/进入目录:# cd ...
- 在Docker中安装和部署MongoDB集群
此文已由作者袁欢授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验. 在Docker中安装mongodb 采用的mongodb镜像:https://registry.hub.doc ...
- mongodb分片集群安装教程
mongodb 集群包含副本集群,主从集群以及分片集群,分片集群比较复杂,这里测试我采用了三台机器,交差部署 blog地址:http://www.cnblogs.com/caoguo 一 .环境:#m ...
- centos7下安装部署mongodb集群(副本集模式)
环境需求:Mongodb集群有三种模式: Replica Set, Sharding,Master-Slaver. 这里部署的是Replica Set模式. 测试环境: 这里副本集(Replica ...
- 搭建高可用mongodb集群(四)—— 分片(经典)
转自:http://www.lanceyan.com/tech/arch/mongodb_shard1.html 按照上一节中<搭建高可用mongodb集群(三)-- 深入副本集>搭建后还 ...
- [转]搭建高可用mongodb集群(四)—— 分片
按照上一节中<搭建高可用mongodb集群(三)—— 深入副本集>搭建后还有两个问题没有解决: 从节点每个上面的数据都是对数据库全量拷贝,从节点压力会不会过大? 数据压力大到机器支撑不了的 ...
- [转]搭建高可用mongodb集群(二)—— 副本集
在上一篇文章<搭建高可用MongoDB集群(一)——配置MongoDB> 提到了几个问题还没有解决. 主节点挂了能否自动切换连接?目前需要手工切换. 主节点的读写压力过大如何解决? 从节点 ...
- 搭建高可用mongodb集群(四)—— 分片
按照上一节中<搭建高可用mongodb集群(三)—— 深入副本集>搭建后还有两个问题没有解决: 从节点每个上面的数据都是对数据库全量拷贝,从节点压力会不会过大? 数据压力大到机器支撑不了的 ...
- 搭建高可用mongodb集群(二)—— 副本集
在上一篇文章<搭建高可用MongoDB集群(一)——配置MongoDB> 提到了几个问题还没有解决. 主节点挂了能否自动切换连接?目前需要手工切换. 主节点的读写压力过大如何解决? 从节点 ...
随机推荐
- 读书笔记--SQL必知必会--常用MySQL(MariaDB)命令
DBMS信息 显示DBMS的版本 select version(); 显示DBMS状态 status; 显示DBMS资源状态 show status; 显示DBMS支持的权限 show privile ...
- Android测试提升效率批处理脚本(三)
前言: 前面放出过几次批处理,这次只放一个环境检查的被管理员给打回来了,不得不再找找几个有含金量的放出来,请看正文~~~ 目录 1.Android环境检查 2.Android内存监控 3.模拟蓝牙手柄 ...
- Grunt学习使用
原文地址:Grunt学习使用必看 grunt简介神马的不多说,到处一大堆. 我只说说我已经实现了的代码. 按照官方的教程 相信已经配置好了,接下来说 package.json 和 Gruntfile. ...
- 在ASP.NET Core Web API上使用Swagger提供API文档
我在开发自己的博客系统(http://daxnet.me)时,给自己的RESTful服务增加了基于Swagger的API文档功能.当设置IISExpress的默认启动路由到Swagger的API文档页 ...
- Windows Phone Toolkit 的 DatePicker 控件本地化的问题
用到 The Windows Phone Toolkit 里的 DatePicker 控件,但是多语言的时候出现了问题: 手机设置为中文,虽然月份跟星期有效,但是 Title 却还是默认的语言:CHO ...
- LinqToDB 源码分析——生成与执行SQL语句
生成SQL语句的功能可以算是LinqToDB框架的最后一步.从上一章中我们可以知道处理完表达式树之后,相关生成SQL信息会被保存在一个叫SelectQuery类的实例.有了这个实例我们就可以生成对应的 ...
- [Winform] DataGridView 中 DataGridViewComboBox 的可编辑
在 DataGridView 中设置的 DataGridViewComboBox,默认是不可编辑的,即使将其列属性 DisplayStyle 设置成 ComboBox 或其他,也无法编辑: 故作如下处 ...
- DataNavigatorButtons
备注 您可以访问使用该控件的DataNavigator.Buttons属性显示在一个的DataNavigator控制按钮设置.该属性的返回值是一个DataNavigatorButtons对象. 下图说 ...
- enote笔记法使用范例(1)——自己总结的一些编写代码的常识 (a)
章节. 编程习惯 why 函数(<<为了>>便于提升软件开发效率和维护效率) 开发角度: 1)隐藏实现细节,这也是API质量最重要的品质2)复用:通过使用函数来代码复用 ...
- 灾难 bzoj 2815
灾难(1s 128MB)catas [样例输入] 5 0 1 0 1 0 2 3 0 2 0 [样例输出] 4 1 0 0 0 题解: 主要算法:拓扑排序:最近公共祖先(Lca): 先跑出拓扑序 我们 ...