GridFS大文件的添加、获取、查看、删除
GridFS是一种在MongoDB中存储大二进制文件的机制,使用GridFS的原因有以下几种:
存储巨大的文件,比如视频、高清图片等。
利用GridFS可以简化需求。
GridFS会直接利用已经建立的复制或分片机制,故障恢复和扩展都很容易
GridFS可以避免用户上传内容的文件系统出现问题。
GridFS不产生磁盘碎片。
GridFS使用两个表来存储数据:
fiiles包含元数据对象(如文件的名称、上传的时间)
chunks包含其他一些相关信息的二进制块
为了使度个GridF命名为一个单一的数据库,文件和块都有一个前缀,默认情况下,前缀是fs。
所以任何默认的GridFS存储将包括命名空间fs.files和fs.chunks。(图片可以命名为ps.files和ps.chunks,视频可以命名为vs.files和vs.chunks)。
各种第三方语言可以更改其前缀。
本文是oschina的happyBKs的文章,请自己标明出处:http://my.oschina.net/u/1156339/blog/388156
使用GridFS mongofiles
mingofiles是从命令行操作GridFS的一种工具
三个命令:put(存储) get(取得) list(列表)
例如:我们将“testfile”这个文件存储到库中,具体做法是 ./mongofiles put testfile
首先,我们尝试压缩归档一个文件。
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles list
- [sudo] password for neil:
- connected to: 127.0.0.1
- [neil@neilhost ~]$ tar zcf mongodbBook.tar.gz Downloads/MongoDB权威指南.pdf
- [neil@neilhost ~]$ ll mongodbBook.tar.gz
- -rw-rw-r--. 1 neil neil 203 3月 16 19:10 mongodbBook.tar.gz
下面我们将这个归档文件存储到mongoDB中。默认存放到test数据库中。
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles put ./mongodbBook.tar.gz
- connected to: 127.0.0.1
- added file: { _id: ObjectId('5506bc01581b37b38b49fecd'), filename: "./mongodbBook.tar.gz", chunkSize: 261120, uploadDate: new Date(1426504705885), md5: "85c0c93f51ebe9c609ffe4f9da71c63e", length: 203 }
- done!
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles list
- connected to: 127.0.0.1
- ./mongodbBook.tar.gz 203
- [neil@neilhost ~]$
之后,我们进入mongodb客户端查看test数据库,发现里面多了两个集合,一个是fs.files,查看之后发现里面记录着上传文件的以下像信息:文件名称、上传时间、md5码、文件长度、大小等。
fs.chunks查看显示二进制信息。
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongo
- [sudo] password for neil:
- MongoDB shell version: 2.6.8
- connecting to: test
- > show tables
- fs.chunks
- fs.files
- system.indexes
- >
- >
- > db.fs.files.find()
- { "_id" : ObjectId("5506bc01581b37b38b49fecd"), "filename" : "./mongodbBook.tar.gz", "chunkSize" : 261120, "uploadDate" : ISODate("2015-03-16T11:18:25.885Z"), "md5" : "85c0c93f51ebe9c609ffe4f9da71c63e", "length" : 203 }
- > db.fs.chunks.find()
- { "_id" : ObjectId("5506bc011b359e376ad0011e"), "files_id" : ObjectId("5506bc01581b37b38b49fecd"), "n" : 0, "data" : BinData(0,"H4sIADm6BlUAA+3OvwsBcRjH8a+uZOE/kNuYuOO+btetMvkD1CHFnfzISgYDZqWU0d9g4w+x3W1mq7uUkmKgpN6v4Xnq+Tz1PJY7ctpuze7nyq7TdK2Sv5l6u4m/mHnLVbZrN8TntEDR0MKum/Kh30gp9LzUdFkIiwhSwzCFqn3h9lvD/qDWU1Xh1FvtV3vv8j+VmsdEfB+tCuV8iMSDwXF7qXQS5va+MTaV9SmZFpmf/QgAAAAAAAAAAAAAAAAAeHYFpzavuwAoAAA=") }
- >
这个文件不大,所以二进制信息很短。
- [neil@neilhost ~]$ du mongodbBook.tar.gz
- 4 mongodbBook.tar.gz
接下来,我尝试将mongodbBook.tar.gz的原文件删除,然后从mongodb中获取恢复。
这里用到的是mongofiles get命令。这里注意的是
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles list
- connected to: 127.0.0.1
- ./mongodbBook.tar.gz 203
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles get mongodbBook.tar.gz
- connected to: 127.0.0.1
- ERROR: file not found
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles get ./mongodbBook.tar.gz
- connected to: 127.0.0.1
- done write to: ./mongodbBook.tar.gz
- [neil@neilhost ~]$ ll
- 总用量 44
- drwxr-xr-x. 2 neil neil 4096 2月 13 18:36 Desktop
- drwxr-xr-x. 3 neil neil 4096 2月 13 21:35 Documents
- drwxr-xr-x. 5 neil neil 4096 3月 15 21:56 Downloads
- -rw-r--r--. 1 root root 203 3月 17 18:27 mongodbBook.tar.gz
- drwxr-xr-x. 2 neil neil 4096 2月 13 18:36 Music
- drwxr-xr-x. 3 neil neil 4096 3月 15 22:50 Pictures
这里需要注意的是,后面get的文件名称需要指定路径,这里要加上./,否则会显示文件不存在。
注意,这个./指的不是linux当前的路径,而是在Mongodb的文件存储中的路径。
之后,有put有get必有delete。
接下来看看如何删除MongoDB中的大文件.
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles list
- [sudo] password for neil:
- connected to: 127.0.0.1
- ./mongodbBook.tar.gz 203
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles delete ./mongodbBook.tar.gz
- connected to: 127.0.0.1
- done!
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongofiles list
- connected to: 127.0.0.1
- [neil@neilhost ~]$ sudo /usr/local/mongodb/bin/mongo
- MongoDB shell version: 2.6.8
- connecting to: test
- > db
- test
- > show collections
- fs.chunks
- fs.files
- system.indexes
- > db.fs.files.find()
- >
- > db.fs.chunks.find()
- >
删除之后可以看到fs.files中的元数据和fs.chunk中的二进制数据都没有了。
--------------------- 本文来自 Ghost丶 的CSDN 博客 ,全文地址请点击:https://blog.csdn.net/linux_hacher/article/details/79663911?utm_source=copy
GridFS大文件的添加、获取、查看、删除的更多相关文章
- Visual Studio 2015 自动生成 的大文件xxx.vc.db的删除问题
用vs2015创建Visual C++项目,编写生成后,每次都会生成一个project_name.VC.db文件,而且会随着你工程修改运行变的越来越大. project_name.VC.db是sqli ...
- 删除Git记录里的大文件
删除Git记录里的大文件 仓库自身的增长 大多数版本控制系统存储的是一组初始文件,以及每个文件随着时间的演进而逐步积累起来的差异:而 Git 则会把文件的每一个差异化版本都记录在案.这意味着,即使你只 ...
- 记一次删除Git记录中的大文件的过程
app/test/target/ #查看大文件 git rev-list --objects --all | grep "$(git verify-pack -v .git/objects/ ...
- 利用Linux的硬连接删除MySQL大文件
利用Linux的硬连接删除MySQL大文件 http://blog.csdn.net/wxliu1989/article/details/22895201 原理:硬链接基础当多个文件共同指向同一ino ...
- Nginx 做代理服务器时浏览器加载大文件失败 ERR_CONTENT_LENGTH_MISMATCH 的解决方案
此文章仅作为本人的笔记,文章转载自 http://blog.csdn.net/defonds/article/details/46042809 Nginx 做反向代理,后端是 tomcat,chro ...
- Linux大文件已删除,但df查看已使用的空间并未减少解决
在我的生活当中遇到磁盘快满了,这时候准备去删除一些大文件 于是我使用ncdu 查看了一下当前系统占用资源比较多的是那些文件,结果一看是elasticsearch的日志文件,好吧,竟然找到源头了,那就把 ...
- 牛客网Java刷题知识点之File对象常用功能:获取文件名称、获取文件路径、获取文件大小、获取文件修改时间、创建与删除、判断、重命名、查看系统根目录、容量获取、获取某个目录下内容、过滤器
不多说,直接上干货! 获取文件名称.获取文件路径.获取文件大小.获取文件修改时间 FileMethodDemo.java package zhouls.bigdata.DataFeatureSelec ...
- 如何安放你的大文件,MongoDB GridFS可以帮助你
1 简介 众所周知(你不知也当你知),MongoDB是以文档(Document)组织数据的.除了常用于存储Json数据,它也是可以存储普通文件的.我们可以把一些文件以BSOON的格式存入MongoDB ...
- [原创]java WEB学习笔记66:Struts2 学习之路--Struts的CRUD操作( 查看 / 删除/ 添加) 使用 paramsPrepareParamsStack 重构代码 ,PrepareInterceptor拦截器,paramsPrepareParamsStack 拦截器栈
本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...
随机推荐
- python3.x之print()
1.print内容 #!/usr/bin/python print('hello world') //print("hello world") 2.print变量 #!/us ...
- 【Java TCP/IP Socket】基于NIO的TCP通信(含代码)
NIO主要原理及使用 NIO采取通道(Channel)和缓冲区(Buffer)来传输和保存数据,它是非阻塞式的I/O,即在等待连接.读写数据(这些都是在一线程以客户端的程序中会阻塞线程的操作)的时候, ...
- influxdb的python操作
1.先安装依赖:pip install influxdb 2.
- git 更新远程分支
使用git的时候,有时候会出现远端更新了一个分支,但是从本地想checkout一个远程分支时,会出现如下错误: fatal: git checkout: updating paths is incom ...
- Json实现异步请求(提交评论)
主要将代码粘贴,通过阅读代码理解当中的相关逻辑. html代码: <form id="form1" runat="server"> <p> ...
- 服务器----1U、2U、3U、4U
U是一种表示服务器外部尺寸的单位,是unit的缩略语,详细的尺寸由作为业界团体的美国电子工业协会(EIA)所决定. 之所以要规定服务器的尺寸,是为了使服务器保持适当的尺寸以便放在铁质或铝质的机架上.机 ...
- Python - colour-science库
http://nbviewer.jupyter.org/github/colour-science/colour-ipython/blob/master/notebooks/colour.ipynb# ...
- 翻译:A Tutorial on the Device Tree (Zynq) -- Part II
A Tutorial on the Device Tree (Zynq) -- Part II 设备树结构 Zynq的设备树如下: /dts-v1/; / { #address-cells = < ...
- 基于DM642 RAW采集格式的视频驱动开发及应用
摘 要:为解决C64X系列数字信号处理器(DSP)视频驱动不能应用于原始数据格式(RAW)采集格式的问题,设计了DM642和电耦合元件(CCD)高清传感器的数据传输接口,并分析.修改用于标准格式的视频 ...
- 【Java】Java代码经典错误清单
一.String 对照 == 和 equals.详细描写叙述例如以下 "=="操作符的作用 1)用于基本数据类型的比較,例如以下: byte(字节) 8 -128 - 127 0 ...