mongo的持久化之Journaling

参考文章：

　　简要介绍：

　　开启Journaling选项相当于启用redo-log，当系统宕机后可以通过redo-log来实现恢复丢失数据的目的。若没有开启Jounaling（使用--nojournal启动的mongod）那么数据会每60秒执行一个fsync提交到磁盘，而开启之后Jounaling的数据默认每100ms（可通过--journalCommitInterval arg修改）提交到磁盘，也就是如果宕机最多丢失100ms的数据。

　　关于原理：开启Journal后会有两个内存映射，分别为shard view, private view，这是所有的读写操作都会到private view中。写操作过程，现将数据写入到private view，将操作写入到Journal日志文件，然后从Journal日志中将操作应用到shard view，最后再将shard view的内容映射到private view之中，实现两个视图一致。

下面内容转载自（写的很好，非常感谢）：http://f.dataguru.cn/thread-139560-1-1.html

先介绍一下Journal：

journal文件在MongoDB中的作用相当于redo日志文件在oracle中的作用，它可以在即使服务器意外宕机的情况下，将数据库操作进行重演。

在64位的机器上，2.0以上版本默认是开启了journal的，但是在32位机器上，或者2.0以下的版本中，默认是不开启journal的。所以在我的安装了2.4.3版本的32位机器上，每次启动mongodb都提示“warning: 32-bit servers don't have journaling enabled by default. Please use --journal if you want durability.”，所以我须要在启动mongodb时带上 --journal 参数；而在默认启动journal的机器上如果不想启动journal，则可以带上 --nojournal 参数。

第一次启动带启用journal的服务前，通常磁盘上是没有journal file的，这时mongodb就会现在磁盘上为journal文件分配磁盘空间，这个过程会花比较长的时间（所以老师的视频演示中，第一次启动服务时花了很长的时间），在这段时间内服务是不可用的。如果想避免这个预分配动作也是可以的，就是从别的mongodb实例中拷贝一个已经预分配的文件，然后放到自己的journal路径中，这个预分配文件是不含数据的，因此是这种操作方式是安全的。另外，我在网上看到有人说如果采用ext4的文件系统，这个预分配的时间就会减小很多（据说ext4在ext3基础上性能的提高，比ext3在ext2基础上性能的提高要高不少），可惜我在尝试做这个实验时，尝试了几次把虚拟机CentOS上的ext3文件系统转为ext4都没有成功，所以最终放弃了这个实验，希望如果有人做了这个实验的话，将过程分享分享。

默认情况下mongodb每100毫秒往journal文件中flush一次数据，不过这是在数据文件和journal文件处于同一磁盘卷上的情况，而如果数据文件和journal文件不在同一磁盘卷上时，默认刷新输出时间是30毫秒。不过这个毫秒值是可以修改的，可修改范围是2~300，值越低，刷新输出频率越高，数据安全度也就越高，但磁盘性能上的开销也更高。

journal文件是以“j._”开头命名的，且是append only的，如果1个journal文件满了1G大小，mongodb就会新创建一个journal文件来使用，一旦某个journal文件所记载的写操作都被使用过了，mongodb就会把这个journal文件删除。通常在journal文件所在的文件夹下，只会存在2~3个journal文件，除非你使用mongodb每秒都写入大量的数据。而使用 smallfiles 这个运行时选项可以将journal文件大小减至128M大小。

Journal的工作原理：
首先要知道在这个原理中，存在着两个file，两个view。两个file是 data file 和 journal file，两个view是 shared view 和 private view。两个file是对磁盘而言的，而两个view是对内存而言的，下面以图解的方式解释：

启动服务前：
<ignore_js_op>

启动服务后，MongoDB请求操作系统将Data file映射到Shared view，此时操作系统只管映射这个动作，并不将数据加载到Shared view中，而是由MongoDB在需要时再将数据进行加载到Shared view。
<ignore_js_op>

然后，MongoDB再请求操作系统将Shared view映射到Private view，之后MongDB对数据的读写操作都是直接操作的Private view：
<ignore_js_op>

如果发生了写操作：
<ignore_js_op>

Private view变脏以后，根据journalCommitInterval的设置，将在一定时间后将写操作往Journal file中复制，这个过程称为“group commit”：
<ignore_js_op>
Journal file中记录的是原生的操作（raw operation），这些原生的操作可以使MongoDB完成以下操作：
对文档的插入/更新（document insertion/updates）
对索引的修改（index modifications）
对命名空间文件的修改（changes to the namespace files）
这些原生操作告诉了Journal file数据变化发生在Data file的什么位置。至此，MongoDB上发生的写事件可以被认为是安全的了，因为这些写操作已经被记录在了Journal file上，即使服务器掉电了，在下次启动MongoDB时，Journal file上的写操作将会被重演。

接下来，Journal file中记录的写操作会应用在Shared view上：
<ignore_js_op>

默认每隔60秒，MongoDB请求操作系统将Shared view刷新输出到Data file：
<ignore_js_op>
数据就被写入到数据文件了。这时MongoDB还会将Journal file中已输出到Data file的写操作删除掉（由于MongoDB在将Journal file中写操作放到Shared view时，是通过了一个前指针和一个后指针来操作的，所以MongoDB知道哪些写操作是被放到Shared view了的，哪些没有）。

最后，MongoDB还会例行地如一开始一样，将Shared view映射到Private view，以保持一致性（也是防止Private view变得太过于脏了）。
<ignore_js_op>

2013-6-13 00:55 上传

下载附件 (18.26 KB)

参考：
MongoDB官方文档、
http://blog.mongodb.org/post/337 ... bs-journaling-works

mongo的持久化之Journaling的更多相关文章

Web集群缓存一致性的思考
共享cache+数据库实现缓存一致性: 1.1 memcache + mongo+定时器 1.1.1 memcache 优点:web集群共享数据缺点:数据生命周期的不可预估性 1.1.2 mongo ...
MongoDB（3）--Java 操作 MongoDB 的 API
引入mongoDb 依赖 <dependency> <groupId>org.mongodb</groupId> <artifactId>mongo-j ...
mongodb的docker化安装
查询mongo镜像 docker search mongo 拉取镜像(拉取STARS最多的那个就可以了) docker pull mongo tips:如果拉取不成功,多pull几次就可以了. 使用自 ...
mongodb aggregate 聚合操作（扁平化flatten）
mongodb自带的函数非常多,最近用mongo做持久化数据库,遇到一个需求:子文档是个数组,把数组里的各个字段扁平化合到根文档中,查过资料后(主要是mongodb的文档和stackoverflow) ...
mongo 是什么
一.概述1.MongoDB是什么?用一句话总结MongoDB是一款为web应用程序和互联网基础设施设计的数据库管理系统.没错MongoDB就是数据库,是NoSQL类型的数据库 2.为什么要使用Mong ...
express－17 持久化
简介所有网站和Web应用程序(除了最简单的)都需要某种持久化方式,即某种比易失性内存更持久的数据存储方式,这样当遇到服务器宕机.断电.升级和迁移等情况时数据才能保存下来. 文件系统持久化实现持久化 ...
mongoDB研究笔记：journaling保证意外故障下的数据完整性
mongoDB的Journaling日志功能与常见的log日志是不一样的,mongoDB也有log日志,它只是简单记录了数据库在服务器上的启动信息.慢查询记录.数据库异常信息.客户端与数据库服务器连接 ...
mongo（五）副本集
mongo(五)副本集配置文件 1-3为三个存储节点,其实一个为Primary,两个secondary作为备份,4为仲裁节点 # mongod.conf #where to log logpath= ...
mongo数据库的导入导出
http://www.iwangzheng.com/ [root@a02]$show dbs; changhong_tv_cms 0.078GB [root@a02]$ mongodump -d ch ...

随机推荐

钉钉开发笔记（5）android系统中html软键盘的适配
最近项目中发现个别Android手机中存在弹出的软键盘会遮挡输入框的现象,最后自己写了一个方法(如下),问题基本解决. 记录下来,防止忘记.有什么不对的地方欢迎指正.O(∩_∩)O 1 //键盘适配 ...
908G New Year and Original Order
传送门分析代码 #include<iostream> #include<cstdio> #include<cstring> #include<string ...
python时间处理详解-乾颐堂
1.获取当前时间的两种方法: import datetime,time now = time.strftime("%Y-%m-%d %H:%M:%S") print now now ...
ajax中 XmlHttp的open( )方法
博客分类: Ajax XML open 创建一个新的http请求,并指定此请求的方法.URL以及验证信息语法 oXMLHttpRequest.open(bstrMethod, bstrUrl, ...
[GO]ticker的使用
package main import ( "time" "fmt" ) //ticker是一个定时触发的计时器,它会以一个间隔往channel发送整一个事件( ...
[GO]errorr接口的使用
package main import ( "fmt" "errors" ) func main() { erro1 := fmt.Errorf("% ...
C#中 Thread，Task，Async/Await，IAsyncResult 的那些事儿！[转载]
说起异步,Thread,Task,async/await,IAsyncResult 这些东西肯定是绕不开的,今天就来依次聊聊他们 1.线程(Thread) 多线程的意义在于一个应用程序中,有多个执行部 ...
mdb
计划开发高性能KV数据库, 学习MongoDB leveldb innodb, 练手贴+日记贴: http://bbs.chinaunix.net/thread-4244870-1-1.html 超高 ...
团体程序设计天梯赛L1-024 后天 2017-03-22 17:59 68人阅读评论(0) 收藏
L1-024. 后天时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者陈越如果今天是星期三,后天就是星期五:如果今天是星期六,后天就 ...
android多lib库工程的自动批量构建--编写ant脚本
基本配置--build.properties 首先编写基本配置build.properties ,主要配置如下: android sdk所在目录编译项目所使用的项目版本 Jdk所在目录以及签名时, ...

mongo的持久化之Journaling

mongo的持久化之Journaling的更多相关文章

随机推荐

热门专题