1.修改oplog的大小 

需要在每个机器上都配置。先在secondary上操作,最后在primary上操作。
1)以单机的方式重启复制集的实例
  1. db.shutdownServer()
在新的端口中启动实例
  1. mongod --port 37017 --dbpath /usr/local/mongodb-linux-x86_64-3.2.0/data
2)备份原来的oplog
  1. [root@node1 mongodb-linux-x86_64-3.2.0]# mongodump --db local --collection 'oplog.rs' --port 37017 2015-12-27T02:27:40.577+0800 writing local.oplog.rs to dump/local/oplog.rs.bson 2015-12-27T02:27:40.579+0800 done dumping local.oplog.rs (4 documents)
3)复制最新的oplog条目到tmp表
  1. [root@node1 mongodb-linux-x86_64-3.2.0]# mongo --port 37017
  2. MongoDB shell version: 3.2.0
  3. connecting to: 127.0.0.1:37017/test
  4. > db.temp.save(db.oplog.rs.find({},{ts:1,h:1}).sort({$natural:-1}).limit(1).next());
  5. WriteResult({ "nInserted" : 1 })
  6. > db.temp.find();
  7. { "_id" : ObjectId("567edd9e48b1a3ebcf06049c"), "ts" : Timestamp(1451203909, 1), "h" : NumberLong("4300737341732033822") }
4)删除原来的oplog
  1. db.oplog.rs.drop()
5)重建oplog
    1. db.runCommand( { create: "oplog.rs", capped: true, size: (2 * 1024 * 1024 * 1024) } )
    2. (单位是字节)
    3. db.oplog.rs.save( db.temp.findOne() ) 把temp中oplog保存到新建的oplog中
    4. db.oplog.rs.find()

6)关闭实例,启动实例为replications sets的成员
  1. db.shutdownServer()
  2. mongod --replSet rs0 --dbpath /usr/local/mongodb-linux-x86_64-3.2.0/data
7)在primary中执行
切换primary为secondary:
  1. rs.stepDown()
然后重复以上操作。

2.执行维护任务的步骤
上面介绍了如何修改oplog。对于Recplication sets来说,执行维护任务的最常用流程如下:
1)关闭secondary节点
use admin
db.shutdownServer()
2)以单实例的方式在不同端口启动该结点
mongod --dbpath /usr/mongodb/data/db --port 37017
3)执行维护任务,比如升级数据库
4)关闭单实例节点
use admin
db.shutdownServer()
5)以replication sets的方式启动节点
mongod --replSet "rs01" --dbpath /usr/local/data/db --port 27017
按上面的方式把所有secondary节点处理完。

在主节点上:
1)执行db.stepDown()切换为secondary节点
2)按照上面的1-5执行

3.强制某个节点变成主节点
原理就是修改节点的优先级。
1)方法一:
有m1,m2,m3三个节点,原来m1是主节点,优先级都是1.执行以下操作:
  1. cfg = rs.conf()
  2. cfg.members[0].priority = 0.5
  3. cfg.members[1].priority = 0.5
  4. cfg.members[2].priority = 1
  5. rs.reconfig(cfg)
此时 m3的优先级最高。如果m3和m1之间的同步进度小于10秒,m1就切换为scondary节点m3就切换为primary节点;如果m3和m1之间的同步进度大于10秒,就先不切换,直接到m3追上m1(进度差小于10秒)

即使m3和m1之间的进度差大于10秒,想让m1变成secondary节点可以执行:
  1. db.adminCommand({replSetStepDown: 86400, force: 1})  24小时内让其成为主节点
此时全部节点为secondary,没有primary节点!
等到m3赶上m1的进度,m3就成了primary节点。

2)方法二
使用命令设置primary
m1,m2,m3,m1为主节点.
在m2上进入mongo:
  1. mongo
  2. >rs.freeze(120);120秒内不能成为主节点
在m1上执行:
  1. mongo
  2. >rs.stepDown(120);120秒内不能成为主节点
这时打开m3发现已经成为主节点。

4.节点执行resync
有两种方式实现resync:
a.清空--dbpath目录,自动实现resync
b.复制其它节点的--dbpath目录内容,然后启动实例,自动使用oplog同步

1)自动resync
a.关闭节点 db.shutdownServer()
b.清空--dbpath目录里的所有内容
c.以replication sets方式启动实例

2)手动复制数据
a.在源节点上做--dbpath的磁盘快照;复制磁盘快照或者直接复制--dbpath目录。
b.替换本节点上的--dbpath目录。
c.启动实例
问题:由于源节点上的--dbpath目录一直在改变,可能无法复制--dbpath目录。所以要做数据快照。

5.强制重新配置replication sets
某些情况下(primary宕机又不能选出primary、配置错误导致大部分的节点宕机),可以使用强制措施重新配置replication sets.正常情况下不要使用。
1)连接到没有宕机的节点上
2)执行
cfg = rs.conf() 

cfg.members = [cfg.members[0] , cfg.members[4] , cfg.members[7]]  去掉宕机的节点
rs.reconfig(cfg, {force : true})  
然后这个设置自动传播到其它节点,之后节点会选出一个primary.

6.Trouble shooting
1)检查replications set状态
rs.status();
2)检查复制间隙
  1. rs0:SECONDARY> rs.printSlaveReplicationInfo();
  2. source: 192.168.75.10:27017
  3. syncedTo: Sun Dec 27 2015 16:11:49 GMT+0800 (CST)
  4. 0 secs (0 hrs) behind the primary
  5. source: 192.168.75.11:27017
  6. syncedTo: Sun Dec 27 2015 16:11:49 GMT+0800 (CST)
  7. 0 secs (0 hrs) behind the primary
有延迟的secondary节点也可能显示落后primary节点0秒。原因:主节点的空闲时间大于从节点上的SlaveDelay值。
复制间隙产生的原因:
  • 网络原因
  • 磁盘原因
  • 大量并发
  • 大量写数据
  • oplog
3)测试连接性
用mongo --host --port  测试各个节点

4)检查oplog日志
rs.printReplicationInfo() 
oplog的日志的大小应该满足至少24个小时的操作,一般48小时或者72小时最好

5) 日志入口时间错误
错误信息:
replSet error fatal couldn't query the local local.oplog.rs collection. Terminating mongod after 30 <timestamp> [rsStart] bad replSet oplog entry?  
原因:一般是由oplog最新一条的ts字段的格式错误造成的。该字段的格式是timestamp。
检查字段:
  1. db = db.getSiblingDB("local")
  2. db.oplog.rs.find().sort({$natural:-1}).limit(1)
  3. db.oplog.rs.find({ts:{$type:17}}).sort({$natural:-1}).limit(1)
如果两个查询没有返回相同的结果,说明日志有错误:
  1. 第一个查询结果
  2. { "ts" : {t: 1347982456000, i: 1},
  3. "h" : NumberLong("8191276672478122996"),
  4. "op" : "n",
  5. "ns" : "",
  6. "o" : { "msg" : "Reconfig set", "version" : 4 } }
  7. 第二个查询结果
  8. { "ts" : Timestamp(1347982454000, 1),
  9. "h" : NumberLong("6188469075153256465"),
  10. "op" : "n",
  11. "ns" : "",
  12. "o" : { "msg" : "Reconfig set", "version" : 3 } }
更新错误的条目:
  1. db.oplog.rs.update( { ts: { t:1347982456000, i:1 } },{ $set: { ts: new Timestamp(1347982456000, 1)}})

7.复制集相关的函数


8.复制输命令




















MongoDB复制二:复制集的管理的更多相关文章

  1. MongoDB高可用架构集群管理(一)

    MongoDB数据库核心的两个特点:第一个特点是副本集的自动切换,保证数据的高可靠.服务的高可用:第二个特点是自动分片.服务的横向扩展能力. (一)副本集架构 MongoDB的副本集是一组保持相同数据 ...

  2. MongoDB 复制(副本集)学习

    MongoDB 复制(副本集)学习 replication set复制集,复制集,多台服务器维护相同的数据副本,提高服务器的可用性.MongoDB复制是将数据同步在多个服务器的过程.复制提供了数据的冗 ...

  3. mongodb 3.4复制集配置

    1:启动三个实例 /bin/mongod --config /home/mongodb/db27017/mongodb27017.conf /bin/mongod --config /home/mon ...

  4. mongodb 3.4复制集详解

    1关闭数据库,打开三个mongodb数据库数据库实例 rs.printReplicationInfo() 2:原理 主库能够进行读写操作,一个复制集群只能有一个活跃的主库 一般情况下复制可以分为好几种 ...

  5. mongodb 复制(副本集)

    复制(副本集) 什么是复制 复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性,并可以保证数据的安全性 复制还允许从硬件故障和服务中断中恢复数据 为什么要复制 数据备份 数据灾 ...

  6. 学习mongo系列(九)索引,聚合,复制(副本集),分片

    一.索引 二.聚合 三.复制(副本集) 四.分片 尚未实践操作. 详见http://www.runoob.com/mongodb/mongodb-indexing.html

  7. Kubernetes(k8s)集群部署(k8s企业级Docker容器集群管理)系列之自签TLS证书及Etcd集群部署(二)

    0.前言 整体架构目录:ASP.NET Core分布式项目实战-目录 k8s架构目录:Kubernetes(k8s)集群部署(k8s企业级Docker容器集群管理)系列目录 一.服务器设置 1.把每一 ...

  8. MySQL复制(二)--基于二进制日志文件(binlog)配置复制

    基础环境:   主库 从库 服务器IP地址 192.168.10.11 192.168.10.12 版本 5.7.24 5.7.24 已存在的数据库 mysql> show databases; ...

  9. MongoDB 事务,复制和分片的关系

    摘要:本文尝试对Mongo的复制和分布式事务的原理进行描述,在必要的地方,对实现的正确性进行论证,希望能为MongoDB内核爱好者提供一些参考. 1.前言 MongoDB基于wiredTiger提供的 ...

  10. MySQL全同步复制基于GR集群架构实现(Centos7)

    目录 一. 理论概述 概述 二. 部署 向组加入新节点 测试 三.总结 一. 理论概述 概述 本案例操作的是针对于MySQL的复制类型中的全同步复制,对几种复制类型简单总结下: 异步复制:MySQL默 ...

随机推荐

  1. sudoers文件解析 转自:http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=1971013

    今天在用户组中新加了一个普通用户,开始这个用户没有sudo权限,于是通过sudo visudo修改了sudo的配置文件,赋予了普通用户的root权限.后来想着能不能将/etc/sudoers文件的访问 ...

  2. mysql的子查询in()操作及按指定顺序显示

    代码示例: in(逗号分隔开的值列表) 释:是否存在于值列表中 --------------------- 示例: select * from test where id in(3,1,5) orde ...

  3. Linux中软件使用笔记

    刚刚接触Linux的小白,难免会碰到各种小问题,不要灰心,总有办法的... 1.搜狗输入法崩溃,打不出中文?都是乱码?一招制敌! 在Terminal中输入下面命令后重启电脑即可重生- 还有,是Sogo ...

  4. JavaScript 笔记总结

    一.js的简介  1.js是什么 js是可以嵌入到html中,是 基于对象 和 事件驱动 的 脚本语言 特点: (1)交互性 (2)安全性:js不能访问本地磁盘 (3)跨平台:浏览器中都具备js解析器 ...

  5. c#一种存储结构解决动态平衡问题

    不说其他了,最近为了实现这么一个场景了而提取的一种结构.我们把一种数据缓存,比如开辟的存储Buffer,或者连接池.放置在一个结构中.很多时候这有一个共同的特点,我们的业务在一段时间会急剧增长,我们开 ...

  6. 2018 Wannafly summer camp Day3--Knight

    Knight 题目描述: 有一张无限大的棋盘,你要将马从\((0,0)\)移到\((n,m)\). 每一步中,如果马在\((x,y)(x,y)\),你可以将它移动到 \((x+1,y+2)(x+1,y ...

  7. 第13届景驰-埃森哲杯广东工业大学ACM程序设计大赛--D-psd面试

    链接:https://www.nowcoder.com/acm/contest/90/D 来源:牛客网 1.题目描述 掌握未来命运的女神 psd 师兄在拿了朝田诗乃的 buff 后决定去实习. 埃森哲 ...

  8. B. Train Seats Reservation 2017 ACM-ICPC 亚洲区(南宁赛区)网络赛

    You are given a list of train stations, say from the station 1 to the station 100. The passengers ca ...

  9. poj 2763 Housewife Wind : 树链剖分维护边 O(nlogn)建树 O((logn)²)修改与查询

    /** problem: http://poj.org/problem?id=2763 **/ #include<stdio.h> #include<stdlib.h> #in ...

  10. Ubuntu 16.04 Server 版安装过程图文详解

    进入系统安装的第一个界面,开始系统的安装操作.每一步的操作,左下角都会提示操作方式!! 1.选择系统语言-English 2.选择操作-Install Ubuntu Server 3.选择安装过程和系 ...