caffe python lmdb读写

caffe中可以采取lmdb健值数据库的方式向网络中输入数据。

所以操作lmdb就围绕“键-值“的方式访问数据库就好了。

Write

我们可以采用cv2来读入自己的图像数据，采用datum格式来存储数据。

Datum is a Google Protobuf Message class used to store data and optionally a label. A Datum can be thought of a as a matrix with three dimensions: width, height, and channel.

import lmdb

import numpy as np

import cv2

import caffe

from caffe.proto import caffe_pb2

#basic setting

# 这个设置用来存放lmdb数据的目录

lmdb_file = 'lmdb_data'

batch_size = 256

# create the lmdb file

# map_size指的是数据库的最大容量，根据需求设置

lmdb_env = lmdb.open(lmdb_file, map_size=int(1e12))

lmdb_txn = lmdb_env.begin(write=True)

# 因为caffe中经常采用datum这种数据结构存储数据

datum = caffe_pb2.Datum()

item_id = -1

for x in range(1000):

    item_id += 1

    #prepare the data and label

    #data = np.ones((3,64,64), np.uint8) * (item_id%128 + 64) #CxHxW array, uint8 or float

    # pic_path设置成图像目录, 0表示读入灰度图

	data = cv2.imread(pic_path, 0)

    # label 设置图像的label就行

    label = item_id%128 + 64

    # save in datum

    datum = caffe.io.array_to_datum(data, label)

    keystr = '{:0>8d}'.format(item_id)

    lmdb_txn.put( keystr, datum.SerializeToString() )

    # write batch

    if(item_id + 1) % batch_size == 0:

        lmdb_txn.commit()

        lmdb_txn = lmdb_env.begin(write=True)

        print (item_id + 1)

# write last batch

if (item_id+1) % batch_size != 0:

    lmdb_txn.commit()

    print 'last batch'

    print (item_id + 1)

Read

import caffe

import lmdb

import numpy as np

import cv2

from caffe.proto import caffe_pb2

lmdb_env = lmdb.open('lmdb_data')

lmdb_txn = lmdb_env.begin()

lmdb_cursor = lmdb_txn.cursor()

datum = caffe_pb2.Datum()

for key, value in lmdb_cursor:

    datum.ParseFromString(value)

    label = datum.label

    data = caffe.io.datum_to_array(datum)

    #CxHxW to HxWxC in cv2

    image = np.transpose(data, (1,2,0))

    cv2.imshow('cv2', image)

    cv2.waitKey(1)

    print('{},{}'.format(key, label))

caffe python lmdb读写的更多相关文章

Windows7 64下搭建Caffe+python接口环境
参考链接: http://www.cnblogs.com/yixuan-xu/p/5858595.html http://www.cnblogs.com/zf-blog/p/6139044.html ...
caffe数据集——LMDB
LMDB介紹 Caffe使用LMDB來存放訓練/測試用的數據集,以及使用網絡提取出的feature(為了方便,以下還是統稱數據集).數據集的結構很簡單,就是大量的矩陣/向量數據平鋪開來.數據之間沒有什 ...
Caffe Python MemoryDataLayer Segmentation Fault
转载请注明出处,楼燚(yì)航的blog,http://home.cnblogs.com/louyihang-loves-baiyan/ 因为利用Pyhon来做数据的预处理比较方便,因此在data_l ...
利用caffe生成 lmdb 格式的文件，并对网络进行FineTuning
利用caffe生成 lmdb 格式的文件,并对网络进行FineTuning 数据的组织格式为: 首先,所需要的脚本指令路径为: /home/wangxiao/Downloads/caffe-maste ...
Caffe Python特征抽取
Caffe Python特征抽取转载 http://www.cnblogs.com/louyihang-loves-baiyan/ Caffe大家一般用到的深度学习平台都是这个,关于Caffe的训练 ...
Python 3 读写文件的简单方法！
Python 3 读写文件的简单方法! a = open('test.txt','w') 这行代码创建了一个名为test的文本文档,模式是写入(模式分为三种,w代表写入,r代表阅读,a代表在尾行添加) ...
ubuntu16.04+caffe+python接口配置
在Windows上用了一个学期的caffe了.深感各种不便,于是乎这几天在ubuntu上配置了caffe和它的python接口,现在记录配置过程,亲测可用: 环境:ubuntu16.04 , caff ...
python文件读写及形式转化和CGI的简单应用
一丶python文件读写学习笔记 open() 将会返回一个 file 对象,基本语法格式如下: open(filename, mode) filename:包含了你要访问的文件名称的字符串值. mo ...
python 文件读写操作（24）
以前的代码都是直接将数据输出到控制台,实际上我们也可以通过读/写文件的方式读取/输出到磁盘文件中,文件读写简称I/O操作.文件I/O操作一共分为四部分:打开(open)/读取(read)/写入(wri ...

随机推荐

Java 常用工具类之 String 类
String 类的特点: 字符串对象一旦被初始化就不会被改变. //以下代码的区别: String s = "abc"; // 在常量池中创建一个字符串对象, 池中没有就建立, 池 ...
线程池ThreadPoolExecutor参数设置
线程池ThreadPoolExecutor参数设置 JDK1.5中引入了强大的concurrent包,其中最常用的莫过了线程池的实现ThreadPoolExecutor,它给我们带来了极大的方便,但同 ...
tpot从elastic search拉攻击数据之二配置端口映射
虽然知道了本地的数据接口位置,但是我们需要的是从远程拉取数据,所以我们需要更改es的ip端口为0.0.0.0:xxxx. 直接修改下图的elasticsearch.yml配置文件,结果发现无效. 这是 ...
Andrew Ng机器学习编程作业:Anomaly Detection and Recommender Systems
作业文件 machine-learning-ex8 在本次练习,第一节我们将实现异常检测算法,并把它应用到检测网络故障服务器上.在第二部分,我们将使用协同过滤来构建电影推荐系统. 1. 异常检测在这 ...
Codeforce 475 C. Kamal-ol-molk's Painting
从最左上的点開始枚举长宽.... C. Kamal-ol-molk's Painting time limit per test 2 seconds memory limit per test 256 ...
ViewConfiguration 和 ViewConfigurationCompat
Contains methods to standard constants used in the UI for timeouts, sizes, and distances. 一.几个常用的方法 ...
Angular学习笔记—路由（转载）
创建路由 1.首先安装 Angular Router.你可以通过运行以下任一操作来执行此操作: yarn add @angular/router # OR npm i --save @angular/ ...
使用反射实现 webdriver page 类
这个类的目的是为了简化page类的实例化,只需要定义public page成员变量然后再启动driver后通过反射实例化page 后面可以直接点出page实例 package crazy.sel ...
基本运算符与流程控制（Day5）
一运算符 1.算数运算 2.比较运算 3.赋值运算 4.逻辑运算 and注解: 在Python 中,and 和 or 执行布尔逻辑演算,如你所期待的一样,但是它们并不返回布尔值:而是,返回它们实际 ...
go——字典
Go中字典类型是散列表(hash table)的一个实现,其官方称谓是map.散列表是一个实现了关联数组的数据结构,关联数组是用于表示键值对的无序集合的一种抽象数据类型.Go中称键值对为键-元素对,它 ...

caffe python lmdb读写

Write

Read

caffe python lmdb读写的更多相关文章

随机推荐

热门专题