GridFS大文件的添加、获取、查看、删除
GridFS是一种在MongoDB中存储大二进制文件的机制,使用GridFS的原因有以下几种:
存储巨大的文件,比如视频、高清图片等。
利用GridFS可以简化需求。
GridFS会直接利用已经建立的复制或分片机制,故障恢复和扩展都很容易
GridFS可以避免用户上传内容的文件系统出现问题。
GridFS不产生磁盘碎片。
GridFS使用两个表来存储数据:
fiiles包含元数据对象(如文件的名称、上传的时间)
chunks包含其他一些相关信息的二进制块
为了使度个GridF命名为一个单一的数据库,文件和块都有一个前缀,默认情况下,前缀是fs。
所以任何默认的GridFS存储将包括命名空间fs.files和fs.chunks。(图片可以命名为ps.files和ps.chunks,视频可以命名为vs.files和vs.chunks)。
各种第三方语言可以更改其前缀。
本文是oschina的happyBKs的文章,请自己标明出处:http://my.oschina.net/u/1156339/blog/388156
使用GridFS mongofiles
mingofiles是从命令行操作GridFS的一种工具
三个命令:put(存储) get(取得) list(列表)
例如:我们将“testfile”这个文件存储到库中,具体做法是 ./mongofiles put testfile
首先,我们尝试压缩归档一个文件。
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles list
- [sudo] password for neil:
- connected to: 127.0.0.1
- [neil@neilhost ~]$ tar zcf mongodbBook.tar.gz Downloads/MongoDB权威指南.pdf
- [neil@neilhost ~]$ ll mongodbBook.tar.gz
- -rw-rw-r--. 1 neil neil 203 3月 16 19:10 mongodbBook.tar.gz
下面我们将这个归档文件存储到mongoDB中。默认存放到test数据库中。
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles put ./mongodbBook.tar.gz
- connected to: 127.0.0.1
- added file: { _id: ObjectId('5506bc01581b37b38b49fecd'), filename: "./mongodbBook.tar.gz", chunkSize: 261120, uploadDate: new Date(1426504705885), md5: "85c0c93f51ebe9c609ffe4f9da71c63e", length: 203 }
- done!
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles list
- connected to: 127.0.0.1
- ./mongodbBook.tar.gz 203
- [neil@neilhost ~]$
之后,我们进入mongodb客户端查看test数据库,发现里面多了两个集合,一个是fs.files,查看之后发现里面记录着上传文件的以下像信息:文件名称、上传时间、md5码、文件长度、大小等。
fs.chunks查看显示二进制信息。
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongo
- [sudo] password for neil:
- MongoDB shell version: 2.6.8
- connecting to: test
- > show tables
- fs.chunks
- fs.files
- system.indexes
- >
- >
- > db.fs.files.find()
- { "_id" : ObjectId("5506bc01581b37b38b49fecd"), "filename" : "./mongodbBook.tar.gz", "chunkSize" : 261120, "uploadDate" : ISODate("2015-03-16T11:18:25.885Z"), "md5" : "85c0c93f51ebe9c609ffe4f9da71c63e", "length" : 203 }
- > db.fs.chunks.find()
- { "_id" : ObjectId("5506bc011b359e376ad0011e"), "files_id" : ObjectId("5506bc01581b37b38b49fecd"), "n" : 0, "data" : BinData(0,"H4sIADm6BlUAA+3OvwsBcRjH8a+uZOE/kNuYuOO+btetMvkD1CHFnfzISgYDZqWU0d9g4w+x3W1mq7uUkmKgpN6v4Xnq+Tz1PJY7ctpuze7nyq7TdK2Sv5l6u4m/mHnLVbZrN8TntEDR0MKum/Kh30gp9LzUdFkIiwhSwzCFqn3h9lvD/qDWU1Xh1FvtV3vv8j+VmsdEfB+tCuV8iMSDwXF7qXQS5va+MTaV9SmZFpmf/QgAAAAAAAAAAAAAAAAAeHYFpzavuwAoAAA=") }
- >
这个文件不大,所以二进制信息很短。
- [neil@neilhost ~]$ du mongodbBook.tar.gz
- 4 mongodbBook.tar.gz
接下来,我尝试将mongodbBook.tar.gz的原文件删除,然后从mongodb中获取恢复。
这里用到的是mongofiles get命令。这里注意的是
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles list
- connected to: 127.0.0.1
- ./mongodbBook.tar.gz 203
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles get mongodbBook.tar.gz
- connected to: 127.0.0.1
- ERROR: file not found
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles get ./mongodbBook.tar.gz
- connected to: 127.0.0.1
- done write to: ./mongodbBook.tar.gz
- [neil@neilhost ~]$ ll
- 总用量 44
- drwxr-xr-x. 2 neil neil 4096 2月 13 18:36 Desktop
- drwxr-xr-x. 3 neil neil 4096 2月 13 21:35 Documents
- drwxr-xr-x. 5 neil neil 4096 3月 15 21:56 Downloads
- -rw-r--r--. 1 root root 203 3月 17 18:27 mongodbBook.tar.gz
- drwxr-xr-x. 2 neil neil 4096 2月 13 18:36 Music
- drwxr-xr-x. 3 neil neil 4096 3月 15 22:50 Pictures
这里需要注意的是,后面get的文件名称需要指定路径,这里要加上./,否则会显示文件不存在。
注意,这个./指的不是linux当前的路径,而是在Mongodb的文件存储中的路径。
之后,有put有get必有delete。
接下来看看如何删除MongoDB中的大文件.
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles list
- [sudo] password for neil:
- connected to: 127.0.0.1
- ./mongodbBook.tar.gz 203
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles delete ./mongodbBook.tar.gz
- connected to: 127.0.0.1
- done!
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles list
- connected to: 127.0.0.1
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongo
- MongoDB shell version: 2.6.8
- connecting to: test
- > db
- test
- > show collections
- fs.chunks
- fs.files
- system.indexes
- > db.fs.files.find()
- >
- > db.fs.chunks.find()
- >
删除之后可以看到fs.files中的元数据和fs.chunk中的二进制数据都没有了。
--------------------- 本文来自 Ghost丶 的CSDN 博客 ,全文地址请点击:https://blog.csdn.net/linux_hacher/article/details/79663911?utm_source=copy
GridFS大文件的添加、获取、查看、删除的更多相关文章
- Visual Studio 2015 自动生成 的大文件xxx.vc.db的删除问题
用vs2015创建Visual C++项目,编写生成后,每次都会生成一个project_name.VC.db文件,而且会随着你工程修改运行变的越来越大. project_name.VC.db是sqli ...
- 删除Git记录里的大文件
删除Git记录里的大文件 仓库自身的增长 大多数版本控制系统存储的是一组初始文件,以及每个文件随着时间的演进而逐步积累起来的差异:而 Git 则会把文件的每一个差异化版本都记录在案.这意味着,即使你只 ...
- 记一次删除Git记录中的大文件的过程
app/test/target/ #查看大文件 git rev-list --objects --all | grep "$(git verify-pack -v .git/objects/ ...
- 利用Linux的硬连接删除MySQL大文件
利用Linux的硬连接删除MySQL大文件 http://blog.csdn.net/wxliu1989/article/details/22895201 原理:硬链接基础当多个文件共同指向同一ino ...
- Nginx 做代理服务器时浏览器加载大文件失败 ERR_CONTENT_LENGTH_MISMATCH 的解决方案
此文章仅作为本人的笔记,文章转载自 http://blog.csdn.net/defonds/article/details/46042809 Nginx 做反向代理,后端是 tomcat,chro ...
- Linux大文件已删除,但df查看已使用的空间并未减少解决
在我的生活当中遇到磁盘快满了,这时候准备去删除一些大文件 于是我使用ncdu 查看了一下当前系统占用资源比较多的是那些文件,结果一看是elasticsearch的日志文件,好吧,竟然找到源头了,那就把 ...
- 牛客网Java刷题知识点之File对象常用功能:获取文件名称、获取文件路径、获取文件大小、获取文件修改时间、创建与删除、判断、重命名、查看系统根目录、容量获取、获取某个目录下内容、过滤器
不多说,直接上干货! 获取文件名称.获取文件路径.获取文件大小.获取文件修改时间 FileMethodDemo.java package zhouls.bigdata.DataFeatureSelec ...
- 如何安放你的大文件,MongoDB GridFS可以帮助你
1 简介 众所周知(你不知也当你知),MongoDB是以文档(Document)组织数据的.除了常用于存储Json数据,它也是可以存储普通文件的.我们可以把一些文件以BSOON的格式存入MongoDB ...
- [原创]java WEB学习笔记66:Struts2 学习之路--Struts的CRUD操作( 查看 / 删除/ 添加) 使用 paramsPrepareParamsStack 重构代码 ,PrepareInterceptor拦截器,paramsPrepareParamsStack 拦截器栈
本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...
随机推荐
- java集合系列之HashMap源码
java集合系列之HashMap源码 HashMap的源码可真不好消化!!! 首先简单介绍一下HashMap集合的特点.HashMap存放键值对,键值对封装在Node(代码如下,比较简单,不再介绍)节 ...
- ClassLoader Java中类加载出现在哪个阶段,编译期和运行期? 类加载和类装载是一样的吗
1.ClassLoader Java中类加载出现在哪个阶段,编译期和运行期? 类加载和类装载是一样的吗? :当然是运行期间啊,我自己有个理解误区,改正后如下:编译期间编译器是不去加载类的,只负责编译而 ...
- Oracle版本–EBS R12.1.1
select * from v$version; Oracle Database 11g Enterprise Edition Release 11.1.0.7.0 - 64bit Productio ...
- J粒子发现40周年-丁肇中中科院讲座笔记
J粒子发现40周年-丁肇中中科院讲座笔记 华清远见2014-10-18 北京海淀区 张俊浩 watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveXVuZm ...
- 创建es索引-格式化和非格式化
创建es索引-格式化和非格式化 学习了:https://www.imooc.com/video/15768 索引有结构化和非结构化的区分: 1, 先创建索引,然后POST修改mapping 首先创建索 ...
- 数据库官方在线文档列表(mysql, postgreSQL)
1. mysql http://dev.mysql.com/doc/ 2. postgreSQL https://www.postgresql.org/docs/
- firefox os 开发模拟器1.4版本号安装开发具体解释
首先在使用firefox os 模拟器的时候必须先下载firefox 浏览器,这个是众多web开发人员必备的工具,下载地址firefox 浏览器 .在最新的官方版本号是1.5版的模拟器,可是如今还不是 ...
- vmware下安装mac os虚拟机问题,最后还是最终攻克了被一个小失误给陷害了
今天决定来体验一下苹果系统.虚拟机文件大概用了一天半时间才下载完毕,解压后是39G大小,赶紧安装VMWARE.然后载入虚拟机文件体验.開始当我苹果标志出来的时候,我以为成功了.但是那个小齿轮一直在转, ...
- IO多路复用:select、poll、epoll示例
一.IO多路复用 所谓IO多路复用,就是通过一种机制,一个进程可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作. Linux支持IO多路复用的系统调用有 ...
- 《Deep Learning》全书已完稿_附全书电子版
Deep Learning第一篇书籍最终问世了.站点链接: http://www.deeplearningbook.org/ Bengio大神的<Deep Learning>全书电子版在百 ...