Caffe使用：如何将一维数据或其他非图像数据转换成lmdb

　　caffe事儿真多，数据必须得lmdb或者leveldb什么的才行，如果数据是图片的话，那用caffe自带的convert_image.cpp就行，但如果不是图片，就得自己写程序了。我也不是计算机专业的，我哪看得懂源码，遂奋发而百度之，然无甚结果，遂google之，尝闻“内事不决问百度，外事不决问google”，古人诚不我欺。在caffe的google group里我找到了这个网址：http://deepdish.io/2015/04/28/creating-lmdb-in-python/

代码如下：

import numpy as np

import lmdb

import caffe

N = 1000

# Let's pretend this is interesting data

X = np.zeros((N, 3, 32, 32), dtype=np.uint8)

y = np.zeros(N, dtype=np.int64)

# We need to prepare the database for the size. We'll set it 10 times

# greater than what we theoretically need. There is little drawback to

# setting this too big. If you still run into problem after raising

# this, you might want to try saving fewer entries in a single

# transaction.

map_size = X.nbytes * 10

env = lmdb.open('mylmdb', map_size=map_size)

with env.begin(write=True) as txn:

    # txn is a Transaction object

    for i in range(N):

        datum = caffe.proto.caffe_pb2.Datum()

        datum.channels = X.shape[1]

        datum.height = X.shape[2]

        datum.width = X.shape[3]

        datum.data = X[i].tobytes()  # or .tostring() if numpy < 1.9

        datum.label = int(y[i])

        str_id = '{:08}'.format(i)

        # The encode is only essential in Python 3

        txn.put(str_id.encode('ascii'), datum.SerializeToString())

　　这是用python将数据转为lmdb的代码，但是我用这个处理完数据再使用caffe会出现std::bad_alloc错误，后来经过艰苦地奋斗，查阅了大量资料，我发现了问题所在：

　　1.caffe的数据格式默认为四维(n_samples, n_channels, height, width) .所以必须把我的数据处理成这种格式

　　2.最后一行txn.put(str_id.encode('ascii'), datum.SerializeToString())一定要加上，我一开始一维python2不用写这个，结果老是出错，后来才发现这行必须写！

　　3.如果出现mdb_put: MDB_MAP_FULL: Environment mapsize limit reached的错误，是因为lmdb默认的map_size比较小，我把lmdb/cffi.py里面的map_size默认值改了一下，改成了1099511627776（也就是1Tb），我也不知道是不是这么改，然后我又把上面python程序里map_size = X.nbytes 这句改成了map_size = X.nbytes * 10，然后就成功了！

　　找资料的过程中，我还发现了用python写leveldb的程序，网址在这里：https://github.com/BVLC/caffe/issues/745和http://stackoverflow.com/questions/32707393/whats-caffes-input-format

　　用python写HDF5的程序在这里：http://stackoverflow.com/questions/31774953/test-labels-for-regression-caffe-float-not-allowed/31808324#31808324

参考：

　　1.http://stackoverflow.com/questions/30983213/how-to-use-1-dim-vector-as-input-for-caffe/30991590#30991590

　　2.关于lmdb的map_size大小的问题：https://github.com/BVLC/caffe/issues/1298和http://stackoverflow.com/questions/31820976/lmdb-increase-map-size　

Caffe使用：如何将一维数据或其他非图像数据转换成lmdb的更多相关文章

Caffe框架,图像数据转换成LMDB数据格式
小码农最近在研究深度学习,对所学知识做点记录,以供以后翻阅.在Caffe框架中,数据的格式都是LMDB的,如何将图像数据转换成这个格式呢? 首先,将图像数据和标签生成txt文档,执行一下代码: fin ...
Caffe学习系列(11)：图像数据转换成db（leveldb/lmdb)文件
在深度学习的实际应用中,我们经常用到的原始数据是图片文件,如jpg,jpeg,png,tif等格式的,而且有可能图片的大小还不一致.而在caffe中经常使用的数据类型是lmdb或leveldb,因此就 ...
caffe(11) 图像数据转换成db文件
在深度学习的实际应用中,我们经常用到的原始数据是图片文件,如jpg,jpeg,png,tif等格式的,而且有可能图片的大小还不一致.而在caffe中经常使用的数据类型是lmdb或leveldb,因此就 ...
caffe学习系列（1）：图像数据转换成db（leveldb/lmdb)文件
参考:http://www.cnblogs.com/denny402/p/5082341.html 上述博文用caffe自带的两张图片为例,将图片转为db格式.博主对命令参数进行了详细的解释,很赞. ...
android实现json数据的解析和把数据转换成json格式的字符串
利用android sdk里面的 JSONObject和JSONArray把集合或者普通数据,转换成json格式的字符串 JSONObject和JSONArray解析json格式的字符串为集合或者一般 ...
Caffe：如何将图片数据转换成lmdb文件
1 图片信息的转换在caffe中经常使用的数据类型是lmdb或leveldb;不是常见的jpg,jpeg,png,tif等格式;因此,需要进行格式转换,通过输入你自己的图片目录(下有的大量图片)转换 ...
caffe 如何训练自己的数据图片
申明:此教程加工于caffe 如何训练自己的数据图片一.准备数据有条件的同学,可以去imagenet的官网http://www.image-net.org/download-images,下载im ...
caffe 中如何打乱训练数据
第一: 可以选择在将数据转换成lmdb格式时进行打乱: 设置参数--shuffle=1:(表示打乱训练数据) 默认为0,表示忽略,不打乱. 打乱的目的有两个:防止出现过分有规律的数据,导致过拟合或者不 ...
caffe(12) 训练自己的数据
学习caffe的目的,不是简单的做几个练习,最终还是要用到自己的实际项目或科研中.因此,本文介绍一下,从自己的原始图片到lmdb数据,再到训练和测试模型的整个流程. 一.准备数据有条件的同学,可以去 ...

随机推荐

怎么提高sql效率
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...
浅谈Runloop
RunLoop 是 iOS 和 OS X 开发中非常基础的一个概念,这篇文章将从 CFRunLoop 的源码入手,介绍 RunLoop 的概念以及底层实现原理.之后会介绍一下在 iOS 中,苹果是如何 ...
第五章搭建S3C6410开发板测试环境
开发板是开发和学习嵌入式技术的主要设备.在这章中介绍了S3C6410开发板,它是三星公司推出的一款低功耗.高性价比的RISC处理器.安装串口调试工具:minicom.它的安装步骤:第1步:检测当前系统 ...
Java中封装、继承和多态
封装: 封装实际上使用方法将类的数据隐藏起来,控制用户对类的修改和访问数据的程度. 适当的封装可以让程式码更容易理解和维护,也加强了程式码的安全性. 访问修饰符有public,private,prot ...
Android开发环境建立
一.For windows 7(注:XP会有问题) 1.JDK-Java SE download: http://www.oracle.com/technetwork/java/javase/down ...
get------引用接口
关于引用接口 1. 通过get方式 2. String poiUrl="http://接口地址?接口ID=接口给你的ID&参数1=?&参数2=?&参数 ...
2016HUAS_ACM暑假集训4A - 递推
利用组合公式C(n,m)=C(n-1,m)+C(n-1,m-1).也就是从n个数里面选择m个数.按递增方式放在每一层循环. 杨辉三角+二项式定理,还真是挺有“意思”的一道题.说实话,非原创.见谅... ...
HTML5画布实现方法：
我们可以在HTML中使用属性width和height来定义Canvas.但是实现Canvas的相关功能主要还依赖于Javascript实现,即HTML5 Canvas API.我们使用javascri ...
OpenGL投影矩阵
概述透视投影正交投影概述计算机显示器是一个2D平面.OpenGL渲染的3D场景必须以2D图像方式投影到计算机屏幕上.GL_PROJECTION矩阵用于该投影变换.首先,它将所有定点数据从观察坐 ...
【亚瑟士 ASICS 系列】
[新配色 36-44] [亚瑟士黑薄荷大工厂流线 36-44] [亚瑟士阿斯克斯星空水洗丹宁 36-44] [亚瑟士阿斯克斯经典爆鼠尾草 36-44] [亚瑟士 ASICS Gel S ...

Caffe使用：如何将一维数据或其他非图像数据转换成lmdb

Caffe使用：如何将一维数据或其他非图像数据转换成lmdb的更多相关文章

随机推荐

热门专题