MongoDB之bson的介绍

1. 什么是bson

BSON是一种类json的一种二进制形式的存储格式,简称Binary JSON,它和JSON一样,支持内嵌的文档对象和数组对象,但是BSON有JSON没有的一些数据类型,如Date和BinData类型。

BSON可以做为网络数据交换的一种存储形式,这个有点类似于Google的Protocol Buffer,但是BSON是一种schema-less的存储形式,它的优点是灵活性高,但它的缺点是空间利用率不是很理想,

BSON有三个特点:轻量性、可遍历性、高效性

{“hello":"world"} 这是一个BSON的例子,其中"hello"是key name,它一般是cstring类型,字节表示是cstring::= (byte*) "/x00" ,其中*表示零个或多个byte字节,/x00表示结束符;后面的"world"是value值,它的类型一般是string,double,array,binarydata等类型。

2. bson在MongoDB中的使用

MongoDB使用了BSON这种结构来存储数据和网络数据交换。把这种格式转化成一文档这个概念(Document),因为BSON是schema-free的,所以在MongoDB中所对应的文档也有这个特征,这里的一个Document也可以理解成关系数据库中的一条记录(Record),只是这里的Document的变化更丰富一些,如Document可以嵌套。

MongoDB以BSON做为其存储结构的一种重要原因是其可遍历性。

3. 几个BSON的例子

3.1 一个Document的BSON表示:

{
title:"MongoDB",
last_editor:"192.168.1.122",
last_modified:new Data("27/06/2011"),
body:"MongoDB introduction",
categories:["Database","NoSQL","BSON"],
revieved:false
}

这是一个简单的BSON结构体,其中每一个element都是由key/value对组成的

3.2 一个嵌套的例子

{
name:"lemo",
age:"",
address:{
city:"suzhou",
country:"china",
code:
}
scores:[
{"name":"english","grade:3.0},
{"name":"chinese","grade:2.0}
]
}

这是一种相对复杂点的例子,其中包括了地址对象和分数对象数组,这里使用了嵌套文档对象与文档对象数据来表示单个学生的信息,这种嵌套的文档结构要使用关系数据库来做是比较复杂的。

4. BSON c++ 代码分析

MongoDB源代码树中包括了BSON的代码库,你只要包含bson.h这个头文件就行了,其中有四个类是比较重要的:

* mongo::BSONObj,这个是BSON对象的表示
* mongo::BSONElement,这个是BSON对象中元素的表示方法
* mongo::BSONObjBuilder,这是构建BSON对象的类
* mongo::BSONObjIterator,这是用来遍历BSON对象中每一个元素的一个迭代器

下面是创建一个BSON对象

BSONObjBuilder b;
b.append("name","lemo"),
b.append("age",);
BSONObj p = b.obj();

或者

BSONObj p = BSONObjBuilder().append("name","lemo").append("age",).obj();  

或者用流的方法来

BSONObjBuilder b;
b << "name" << "lemo" << "age" << ;
BSONObj p = b.obj();

或者用宏来创建一个对象

BSONObj p = BSON( "name" << "Joe" << "age" <<  ); 

这里分析一下这四个类的一些代码:

mongo::BSONObj主要是用于存储BSON对象的,具体的存储格式如下

 <unsigned totalSize> {<byte BSONType><cstring FieldName><Data>}* EOO
-------------------- ------------- ----------------- ---- ---
totalSize: 一个总的字节长度,包含自身
BSONType: 对象类型,这里有Boolean,String,Date等类型,具体可以参考bsontypes.h这个文件
FieldName: 这里表示字段名
Data: 这里是放具体的数据,数据的存储方式根据不同的BSONType来
* : 表示可以有多个元素组成
EOO: 这是一个结束符,一般是/x00来表示

一般来说,BSONObj的创建都是通过BSONObjBuilder来做的,除非你已经得到了其字节流,那可以直接生成BSONObj

mongo::BSONElement 它主要是用于存储对象中的单个元素,存储格式如下

<type><fieldName><value> 

这个对象主要是指向BSONObj对象中具体元素的地址,它不实际存储元素的值。

mongo::BSONObjBuilder 它主要是用于生成BSONObj,这个对象集成了StringBuilder,它主要用于存储实际的字节点,用于替换std::stringstream,而这个StringBuilder集成了BufBuilder,这是一个可以动态增长内存缓冲区,但最大容量不能超过64MB的大小,也就是说一个BSONObj最大不能超过64MB。

mongo::BSONOBjIterator 它主要是用来遍历BSONObj对象中的每一个元素,提供了类似于stl iterator的一些接口,它还提供了一个ForEach宏来提供更方便的操作,如

if (foo) {
BSONForEach(e, obj)
doSomething(e);
}

5. 参考

* http://www.mongodb.org/pages/viewpage.action?pageId=16646453

* http://bsonspec.org/

* http://www.mongodb.org/display/DOCS/BSON

MongoDB之bson的介绍的更多相关文章

  1. DataBase MongoDB集群方案介绍

    MongoDB集群方案介绍 一.什么是mongodb集群? 是指由多台mongodb服务器组成的服务器集群,称之为mongodb集群. 二.mongodb集群搭建的方式: 1.Replica Set  ...

  2. 处理范例代码Webapi中的Mongodb的Bson中ObjectId反序列化异常

    微软代码范例中的一个Bug 处理Mongodb的Bson中ObjectId反序列化异常 https://docs.microsoft.com/zh-cn/aspnet/core/tutorials/f ...

  3. MongoDB集群方案介绍

    MongoDB集群方案介绍 一.什么是mongodb集群? 是指由多台mongodb服务器组成的服务器集群,称之为mongodb集群. 二.mongodb集群搭建的方式: 1.Replica Set  ...

  4. MongoDB导入bson文件(元数据),mongorestore命令行方式导入

    MongoDB导入bson文件(元数据),mongorestore命令行方式导入 不推荐使用MongoDB Compass等图形化数据库管理软件,例如MongoDB Compass只能导入json和c ...

  5. [MongoDB] - Window7下安装及BSON基本介绍

    MongoDB是一种NOSQL(Not Only SQL)类型的文档型数据库.NoSQL数据库与传统的关系型数据库相比,它具有操作简单.完全免费.源码公开.随时下载等特点,并可以用于各种商业目的.Mo ...

  6. MongoDB中的MapReduce介绍与使用

    一.简介 在用MongoDB查询返回的数据量很大的情况下,做一些比较复杂的统计和聚合操作做花费的时间很长的时候,可以用MongoDB中的MapReduce进行实现 MapReduce是个非常灵活和强大 ...

  7. MongoDB系列二(介绍).

    一.特点 学习一个东西,至少首先得知道它能做什么?适合做什么?有什么优缺点吧? 传统关系型数据库,遵循三大范式.即原子性.唯一性.每列与主键直接关联性.但是后来人们慢慢发现,不要把这些数据分散到多个表 ...

  8. Mongodb系列- CRUD操作介绍

    ---恢复内容开始--- 一 Create 操作 在MongoDB中,插入操作的目标是一个集合. MongoDB中的所有写入操作在单个文档的层次上都是原子的. For examples, see In ...

  9. Navicat Premium连接mongodb基本使用和介绍

    Navicat premium是一款数据库管理工具,是一个可多重连线资料库的管理工具, 它可以让你以单一程式同时连线到 MySQL.SQLite.Oracle 及 PostgreSQL,mongodb ...

随机推荐

  1. [3]MVC3中使用Telerik(转)

    ASP.NET MVC的Model元数据与Model模板:预定义模板 http://www.cnblogs.com/artech/archive/2012/05/02/model-metadata-a ...

  2. win系统 添加、修改右键“发送到”

    发现大家在往U盘,移动硬盘传东西的时候,总是喜欢在本地把文件复制(缺德的还会用剪切)然后在打开U盘选择粘贴,其实完全没必要使用那么多步骤,不知道大家注意没有,只要在你本地的文件上右键--发送到--你的 ...

  3. ios 解析html

    xml,json都有大量的库来解析,我们如何解析html呢? TFHpple是一个小型的封装,可以用来解析html,它是对libxml的封装,语法是xpath.今天我看到一个直接用libxml来解析h ...

  4. 获取iOS系统版本 --- UIDevice

    UIDevice类是一个单例,其唯一的实例( [UIDevice currentDevice] ) 代表了当前使用的设备. 通过这个实例,可以获得设备的相关信息(包括系统名称,版本号,设备模式等等). ...

  5. 用CNTK搞深度学习 (二) 训练基于RNN的自然语言模型 ( language model )

    前一篇文章  用 CNTK 搞深度学习 (一) 入门    介绍了用CNTK构建简单前向神经网络的例子.现在假设读者已经懂得了使用CNTK的基本方法.现在我们做一个稍微复杂一点,也是自然语言挖掘中很火 ...

  6. 推荐一款超强大的基于Angularjs的自动完成(Autocomplete)标签及标签组插件–ngTagsInput

    前言 今天利用中午午休时间,给大家分享推荐一款基于Angularjs的自动完成(Autocomplete)标签及标签组插件--ngTagsInput,功能超强大的.不信,你试试就知道^_^... Au ...

  7. Scala之类型参数和对象

    泛型 类型边界 视图界定 逆变和协变 上下文界定 源代码 1.泛型 泛型用于指定方法或类可以接受任意类型参数,参数在实际使用时才被确定,泛型可以有效地增强程序的适用性, 使用泛型可以使得类或方法具有更 ...

  8. Jquery.validate.js表单验证插件的使用

    作为一个网站web开发人员,以前居然不知道还有表单验证这样好呀的插件,还在一行行写表单验证,真是后悔没能早点知道他们的存在. 最近公司不忙,自己学习一些东西的时候,发现了validation的一个实例 ...

  9. 初探JAVA中I/O流(二)

    1.缓冲输入文件 FileReader BufferedReader FileReader可以直接对文件进行读操作.但是简化编程,加快读取速度,我们加入了缓冲机制,使用了BufferedReader. ...

  10. 网站开发技巧, 使用byte[]持久化用户个性设置

    场景, 网站用户的个性化配置较多, 而且容易发生增加和改变, 如何在数据库保存是个问题. 为了避免数据库表字段经常变更, 我们设计在表增加一个varbinary(max)字段存储个性化配置. 个性化的 ...