MongoDb GridFS 是MongoDB的文件存储方案,主要用于存储和恢复那些超过16M(BSON文件限制)的文件(如:图片、音频等),对大文件有着更好的性能。

要在C#中使用GridFS,首先安装Nuget包: MongoDB.Driver.GridFS

Bucket

GridFS中的数据也是分集合存储的,每个集合叫一个bucket,每个bucket里面可以存储多个文件:

在C#中使用bucket和使用集合差不多,创建一个GridFSBucket对象即可。

var bucket = new GridFSBucket(db, new GridFSBucketOptions()
{
    BucketName     = "my_bucket",
    ChunkSizeBytes = 256 * 1024, //块大小
});

对于bucket,主要的参数就是bucket名称和块大小,它也不用手动创建,在使用的时候会自动创建。

上传数据

对于byte[]数组,可以直接使用UploadFromBytes上传:

var data = Enumerable.Range(0, 256).Select(i => (byte)i).ToArray();
var id = bucket.UploadFromBytes("filename", data);

主要参数是传入一个文件名(文件名并不要求唯一,同一bucket类可以重复),返回数据id。

也可以带入metadata信息。

var options = new GridFSUploadOptions
{
    Metadata = new BsonDocument
    {
        {"resolution", "1080P"},
        {"copyrighted", true}
    },
    DisableMD5 = true,
};
var id   = bucket.UploadFromBytes("filename", data, options);

上传Stream

使用UploadFromBytes上传的时候,需要将上传的数据全部读取到内存,如果需要上传的是较大的文件,这种方式并不合适。此时可以使用UploadFromStream函数上传。

using (var fs = File.OpenRead(@"r:\123.jpg"))
{
    bucket.UploadFromStream("123.jpg", fs);
}

也可以使用OpenUploadStream的方式打开为一个Stream,然后通过推的方式完成上传。

using (var fs = File.OpenRead(@"r:\123.jpg"))
using (var upload = bucket.OpenUploadStream("123.jpg"))
{
    fs.Copy(upload);
    upload.Close();
    Console.WriteLine(upload.Id);
}

注意:这个stream必须手动Close,只是调用Dispose不会写入到bucket中去。不知道算不算MongoDB API的一个bug。另外,GridFS的这个GridFSUploadStream.Close是通过隐藏的方式实现的,如果将他转换成了Stream使用,此时调用Close不能上传至GridFS,需要将其转换成GridFSUploadStream才行。

下载:

下载的API和上传类似,如下是几个基本示例:

var id = new ObjectId("5b6ba04c77850928a438b1b2");
var bytes = bucket.DownloadAsBytes(id); using (var target = File.Create(@"r:\target.jpg"))
{
    bucket.DownloadToStream(id, target);
} using (var download = bucket.OpenDownloadStream(id))
using (var target = File.Create(@"r:\target.jpg"))
{
    download.CopyTo(target);
}

查询:

GridFS 用两个集合来存储一个文件:fs.files与fs.chunks。对于bucket中的记录,实际上存成了两个部分。

  • 文件的实际内容被存在chunks(二进制数据)中,拆分成了一堆chunk存储
  • 相关的描述信息files集合中,它是一个标准的mongodb的文档模型,其结构为:
{
"_id" : <ObjectId>,
"length" : <num>,
"chunkSize" : <num>,
"uploadDate" : <timestamp>,
"md5" : <hash>,
"filename" : <string>,
"contentType" : <string>,
"aliases" : <string array>,
"metadata" : <any>,
}
gridfs对filename 和uploadDate字段做了索引的,通过它们查询能获取到较好的性能。

参考文档: https://docs.mongodb.com/manual/core/gridfs/

gridfs的api中封装了对它的查询,也是遵循标准的查询API的

var filter = new {filename = "123.jpg"};
var result = bucket.Find(filter.ToBsonDocument()).ToList();

另外,也可以直接操作fs.files集合。

var files = db.GetCollection<BsonDocument>("my_bucket.files");

更新:

GridFS的API支持对文档重命名:

bucket.Rename(id, "NewName");

但没有找打更新MetaData的API,在网上找了一下,有人已经提了这个问题。结论是目前官方没有封装,不过可以从fs.files集合中直接更新metadata。示例如下。

var files = db.GetCollection<BsonDocument>("my_bucket.files");

var filter = new BsonDocument()
{
    ["_id"] = id
};
var update = new BsonDocument()
{
    ["$set"] = new BsonDocument()
    {
        ["metadata"] = metaData
    }
}; files.UpdateOne(filter, update);

小结

Gridfs的API封装还算好用的,就是不过不知道为什么没有封装对描述信息的更新操作。官方文档链接如下,要深入学习的可以查看一下。

本文这里主要介绍的是GridFS的使用,但需要注意的是,GridFS本身并不是分布式存储服务,它仍然依赖于MongoDB,并不是解决大规模的分布式存储的问题的,需要大容量存储和负载均衡等场景建议还是交给FastDFS等专业的服务来。

不过,对于一些性能和容量要求不高的企业应用,存储一些图片,附件等小规模存储场景,还是非常合适的。部署和使用都是非常方便快捷的。

另外,网上也有一些深入点介绍GridFS的文档,也可以看下。

MongoDb GridFS的使用的更多相关文章

  1. CentOS6.3搭建Nginx代理访问MongoDB GridFS图片资源

    PHP可以直接读取MongoDB GridFS中的图片并显示到页面中,但对PHP的压力就大了.偶然机会,了解到Nginx可以代理访问,实现过程如下: 1.工具准备 安装一些必要的编译工具及库,这里是直 ...

  2. MongoDB的学习和使用(MongoDB GridFS)

    MongoDB GridFS GridFS 用于存储和恢复那些超过16M(BSON文件限制)的文件(如:图片.音频.视频等). GridFS 也是文件存储的一种方式,但是它是存储在MonoDB的集合中 ...

  3. MongoDB GridFS 存储大文件

    我们经常会遇到这样的场景:上传/下载文件. 有两种思路可以解决这个问题: (1)将文件存储在服务器的文件系统中: (2)将文件存储在数据库中. 如果我们选择(2),那么我们可以使用MongoDB Gr ...

  4. MongoDB GridFS 存储文件

    使用MongoDB的GridFS方式. CSDN: https://blog.csdn.net/qq_32657967/article/details/81534259官方文档: https://do ...

  5. mongodb gridfs基本使用

    Mongodb GridFS图片文件存储解决方案 之前解决方案是接收图片数据后,将图片直接存储到盘阵,然后通过Apache做服务器,将图片信息存储到数据库,并且存储一个Apache的访问路径. 目前需 ...

  6. MongoDB GridFS最佳应用概述

    <MongoDB GridFS最佳应用概述> 作者:chszs,转载需注明.博客主页:http://blog.csdn.net/chszs GridFS是MongoDB数据库之上的一个简单 ...

  7. MongoDB GridFS——本质上是将一个文件分割为大小为256KB的chunks 每个chunk里会放md5标识 取文件的时候会将这些chunks合并为一个整体返回

    MongoDB GridFS GridFS 用于存储和恢复那些超过16M(BSON文件限制)的文件(如:图片.音频.视频等). GridFS 也是文件存储的一种方式,但是它是存储在MonoDB的集合中 ...

  8. Spring Boot使用MongoDB GridFS进行文件的操作

    1. GridFS简介 GridFS 用于存储和恢复那些超过16M(BSON文件限制)的文件(如:图片.音频.视频等),但是它是存储在MonoDB的集合中. GridFS 会将文件对象分割成多个的ch ...

  9. 【荐】PHP操作MongoDB GridFS 存储文件,如图片文件

    GridFS是MongoDB的一个内置功能,它提供一组文件操作的API以利用MongoDB存储文件,GridFS的基本原理是将文件保存在两个Collection中,一个保存文件索引,一个保存文件内容, ...

随机推荐

  1. 【转】CocoaLumberjack——带颜色的Log

    CHENYILONG Blog [转]CocoaLumberjack--带颜色的Log - 趣味苹果开发 - 博客园 转自:趣味苹果开发   CocoaLumberjack--带颜色的Log Coco ...

  2. spring如何管理mybatis(二) ----- SqlSession的线程安全性

    在之前的文章中我们了解到最终的数据库最终操作是走的代理类的方法: @Override public Object invoke(Object proxy, Method method, Object[ ...

  3. Ansible 插件 之 【CMDB】【转】

    Github地址: https://github.com/fboender/ansible-cmdb 从facts收集信息,生成主机概述 安装 wget https://github.com/fboe ...

  4. Android 4.4 API

    Android 4.4 (KITKAT) 是新的 Android 平台版本,为用户和应用开发者提供了新功能.本文旨在介绍其中最值得关注的新 API. 作为应用开发者,您应尽快从 SDK 管理器下载 A ...

  5. Java中包的介绍

    包的介绍: 未命名包 命名包 可以避免类名重复 为了更好地组织类,Java 提供了包机制,用于区别类名的命名空间. 包的作用 1.把功能相似或相关的类或接口组织在同一个包中,方便类的查找和使用. 2. ...

  6. VMWare 虚拟机 安装 Mac OS X

    VMWare安装Mac OS X 随着iPhone.iPad.Mac等苹果产品越来越火爆,越来越多的初学者想要了解和尝试苹果平台,包括苹果操作系统Mac OS X.苹果演示软件Keynote.苹果开发 ...

  7. enum 关键字

    java.lang.Enum.java enum :枚举类型当你需要创建一个整型常量集,但是这些枚举值并不会必然地将其自身的取值限制在这个常量的范围之内,这种情况可以用枚举 package objec ...

  8. SOA 设计的 9 大原则

    面向服务的架构 (SOA) 设计要尽可能地简单.在设计一个 SOA 服务的时候要谨记这 9 大设计原则: 1. 标准服务契约 服务要遵循一个服务描述. 2. 松耦合 服务之间的依赖最小化. 3. 服务 ...

  9. 解决Python3 pip list 红色DEPRECATION

    解决Python3 pip list 红色DEPRECATION 打开文件扩展名和隐藏的项目 找到ProgramData,在该目录下创建pip文件夹,在pip里面创建pip.ini  在pip.ini ...

  10. AJAX请求时status返回状态明细表(转)

    转自:http://www.cnblogs.com/wangking/p/6530904.html AJAX请求时status返回状态明细表 readyState的五种状态2010-03-04 18: ...