mongodb持久化

先上一张图(根据此处重画)，看完下面的内容应该可以理解。

mongodb使用内存映射的方式来访问和修改数据库文件，内存由操作系统来管理。开启journal的情况，数据文件映射到内存2个view：private view和write view。对write view的更新会刷新到磁盘，而对private view的更新不刷新到磁盘。写操作先修改private view，然后批量提交(groupCommit)，修改write view。

WriteIntent
发生写操作时，会记录修改的内存地址和大小，由结构WriteIntent表示。

/** Declaration of an intent to write to a region of a memory mapped view

 *  We store the end rather than the start pointer to make operator< faster

 *    since that is heavily used in set lookup.

 */

struct WriteIntent { /* copyable */

    void *p;      // intent to write up to p

    unsigned len; // up to this len

    void* end() const { return p; }

    bool operator < (const WriteIntent& rhs) const { return end() < rhs.end(); } // 用于排序

};

WriteIntent

查看代码会发现大量的类似调用，这就是保存WriteIntent。

getDur().writing(..)
getDur().writingPtr(...)

CommitJob
CommitJob保存未批量提交的WriteIntent和DurOp，目前只使用一个全局对象commitJob。对于不修改数据库文件的操作，如创建文件(FileCreatedOp)、删除库(DropDbOp)，不记录WriteIntent，而是记录DurOp。

ThreadLocalIntents
由于mongodb是多线程程序，同时操作CommitJob需要加锁(groupCommitMutex)。为了避免频繁加锁，使用了线程局部变量

/** so we don't have to lock the groupCommitMutex too often */

class ThreadLocalIntents {

    enum { N =  };

    std::vector<dur::WriteIntent> intents;

};

ThreadLocalIntents

WriteIntent先存放到intents里，当intents的大小达到N时，就添加到CommitJob里，这时候要才需要加锁。添加intents到CommitJob时，会对重叠的内存地址段进行合并，减少WriteIntent的数量。当然，CommitJob也会对添加的WriteIntent进行检查是否重复添加。这里有一个问题，如果intents的大小没有达到N，是不是永远都不添加到CommitJob里呢？不会。因为每次写操作，必须先获得'w'锁(库的写锁)或者'W'锁(全局写锁)，当释放锁的时候，也会把intents添加到全局的数组里。

何时groupCommit
写操作会先修改private view，并保存WriteIntent到CommitJob。但是private view是不持久化的，CommitJob保存的WriteIntent何时groupCommit？

const unsigned UncommittedBytesLimit = (sizeof(void*)==) ?  *  *  :  *  * ;

UncommittedBytesLimit

durThread线程定期groupCommit，间隔时间可以由journalCommitInterval选项指定。默认是100毫秒(journal文件所在硬盘分区和数据文件所在硬盘相同)或者30毫秒。另外，如果有线程在等待groupCommit完成，或者未commit的字节数大于UncommittedBytesLimit / 2，会提前commit。
调用commitIfNeeded。如果未commit的字节数不小于UncommittedBytesLimit，或者是强制groupCommit，则执行groupCommit。

groupCommit的过程

1.PREPLOGBUFFER

首先是生成写操作日志(redo log)。对WriteIntent从小到大排序，这样可以对前后的WriteIntent进行重叠、重复的合并。对每个WriteIntent的地址，和每个数据文件的private view的基地址进行比较(private view的基地址已经排序，查找很快)，找出其隶属的数据文件的标号。WriteIntent的地址减掉private view的基地址得到偏移，再从private view把修改的数据复制下来。这样数据文件标号、偏移、数据，形成一个JEntry。

2.WRITETOJOURNAL

把写操作日志压缩并写入journal文件。这一步完成之后，即使mongodb异常退出，数据也不会丢失了，因为可以根据journal文件中的写操作日志重建数据。关于journal文件可以参见这里。

3.WRITETODATAFILES

把所有写操作更新到write view中。后台线程DataFileSync会定期把write view刷新到磁盘中，默认是60秒，由syncdelay选项指定。

4.REMAPPRIVATEVIEW

private view是copy on write的，即在发生写时开辟新的内存，否则是和write view共用一块内存的。如果写操作很频繁，则private view会申请很多的内存，所以private view会remap，防止占用内存过多。并不是每次groupCommit都会remap，只有持有'W'锁的情况下才会remap。

durThread线程的定期groupCommit有三种情况会remap

privateMapBytes >= UncommittedBytesLimit
前面9次groupCommit都没有ramap
durOptions选项指定了DurAlwaysRemap

调用commitIfNeeded发生的groupCommit，如果持有持有'W'锁则remap。

remap的一个问题

在_REMAPPRIVATEVIEW()函数中，有这样一段代码

#if defined(_WIN32) || defined(__sunos__)

            // Note that this negatively affects performance.

            // We must grab the exclusive lock here because remapPrivateView() on Windows and

            // Solaris need to grab it as well, due to the lack of an atomic way to remap a

            // memory mapped file.

            // See SERVER-5723 for performance improvement.

            // See SERVER-5680 to see why this code is necessary on Windows.

            // See SERVER-8795 to see why this code is necessary on Solaris.

            LockMongoFilesExclusive lk;

#else

            LockMongoFilesShared lk;

#endif

执行remap时，需要LockMongoFiles锁。win32下，这把锁是排他锁；而其他平台下(linux等)是共享锁。write view刷新到磁盘的时候，也需要LockMongoFiles共享锁。这样，在win32下，如果在执行磁盘刷新操作，则remap操作会被阻塞；而在执行remap之前，已经获得了'W'锁，这样会阻塞所有的读写操作。因此，在win32平台下，太多的写操作(写操作越多，remap越频繁)会导致整个数据库读写阻塞。

在win32和linux下做了一个测试，不停的插入大小为10k的记录。结果显示如下：上图win32平台，下图为linux平台；横坐标为时间轴，从0开始；纵坐标为每秒的插入次数。很明显的，linux平台的性能比win32好很多。

mongodb持久化的更多相关文章

redis mongodb持久化的方式
目录 redis持久化方式(两种) RDB持久化 AOF持久化两种持续化方式需要明确的问题对比 MongoDB持久化方式 redis持久化方式(两种) RDB持久化 redis提供了RDB持久化的 ...
scrapy框架的另一种分页处理以及mongodb的持久化储存以及from_crawler类方法的使用
一.scrapy框架处理 1.分页处理以爬取亚马逊为例爬虫文件.py # -*- coding: utf-8 -*- import scrapy from Amazon.items import ...
MongoDB丢数据问题的分析
坊间有很多传说MongoDB会丢数据.特别是最近有一个InfoQ翻译的Sven的一篇水文(为什么叫做水文?因为里面并没有他自己的原创,只是搜罗了一些网上的博客,炒了些冷饭吃),其中又提到了丢数据的事情 ...
HBase、Redis、MongoDB、Couchbase、LevelDB主流 NoSQL 数据库的对比
最近小组准备启动一个 node 开源项目,从前端亲和力.大数据下的IO性能.可扩展性几点入手挑选了 NoSql 数据库,但具体使用哪一款产品还需要做一次选型. 我们最终把选项范围缩窄在 HBase.R ...
Redis、Memcache和MongoDB的区别
>>Memcached Memcached的优点:Memcached可以利用多核优势,单实例吞吐量极高,可以达到几十万QPS(取决于key.value的字节大小以及服务器硬件性能,日常环境 ...
Redis、Memcache与MongoDB的区别
>>Memcached Memcached的优点:Memcached可以利用多核优势,单实例吞吐量极高,可以达到几十万QPS(取决于key.value的字节大小以及服务器硬件性能,日常环境 ...
redis和mongodb的比较
>>RedisRedis的优点:支持多种数据结构,如 string(字符串). list(双向链表).dict(hash表).set(集合).zset(排序set).hyperloglog ...
三个缓存数据库Redis、Memcache、MongoDB
>>Memcached Memcached的优点:Memcached可以利用多核优势,单实例吞吐量极高,可以达到几十万QPS(取决于key.value的字节大小以及服务器硬件性能,日常环境 ...
Redis、Memcache和MongoDB
一.Memcached Memcached的优点:Memcached可以利用多核优势,单实例吞吐量极高,可以达到几十万QPS(取决于key.value的字节大小以及服务器硬件性能,日常环境中QPS高峰 ...

随机推荐

C# 自定义重绘DataGridView
using System.Collections.Generic; using System.ComponentModel; using System.Diagnostics; using Syste ...
WPF 之 WPF应用程序事件
当新建一个wpf应用程序,会自动生成一个App.xaml和MainWindow.xaml文件. 其中 App.xam 用来设置Application,应用程序的起始文件和资源及应用程序的一些属性和事件 ...
Data Structure 之二叉树
在计算机科学中,二叉树是每个节点最多有两个子树的树结构.通常子树被称作“左子树”(left subtree)和“右子树”(right subtree).二叉树常被用于实现二叉查找树和二叉堆 ...
下拉选择框加listview删除
package com.downselect; import java.util.ArrayList; import android.R.array; import android.app.Activ ...
【阿里云产品公测】结构化数据服务OTS之JavaSDK初体验
[阿里云产品公测]结构化数据服务OTS之JavaSDK初体验作者:阿里云用户蓝色之鹰一.OTS简单介绍 OTS 是构建在阿里云飞天分布式系统之上的NoSQL数据库服务,提供海量结构化数据的存储和实 ...
Java各种类型占用的字节数
Java 占用字节数转自:http://www.blogjava.net/stevenjohn/archive/2013/10/18/405416.html 数据类型大小(二进制位数) 范围默认 ...
vb.net机房收费系统之配置文件
总是听到说用反射+配置文件访问数据库,那配置文件到底什么东西? 1.定义: 配置文件是标准的 XML 文件,XML 标记和属性是区分大小写的.它是可以按需要更改的,开发人员可以使用配置文件来更改设置, ...
React Native学习-measure测量view的宽高值
measure()测量是根据view标签中的ref属性,使用方法如下: measureWatermarkerImage(){ this.refs.watermarkerImage.measure((a ...
ionic中input框禁止输入问题
其实这个问题在之后沥青思路之后觉得还是挺好实现的,没有思路的时候真是找不到头绪~ 功能的描述为:当输入框中没有内容时,允许用户编辑:当其中有内容时不允许用户编辑,只有当用户点击编辑按钮后,才可允许编辑 ...
Smart法则
设立目标不是一个很简单的事情.人们经常会犯一些基本的错误,即过于理想化.不符合客观情况.不容易执行落实,因此计划容易变成一种“美好的愿望”而已.在20世纪70年代,一位美国人为设立目标做出了一个简单而 ...

mongodb持久化

mongodb持久化的更多相关文章

随机推荐

热门专题