前期准备：
文件夹train：此文件夹中按类别分好子文件夹，各子文件夹里存放相应图片
文件夹test：同train，有多少类就有多少个子文件夹
trainlabels.txt ：存的是训练集的标签
testlables.txt：存的是测试集的标签
(特别注意：文件的路径以及文件名要对应)

第一步

生成train文件夹和test文件夹以及标签文件。本文用的是matlab对数据集进行读取，然后输出图片到相应文件夹中，并且生成标签文件。此处给出matlab的代码，请自行分析。

%% 实现图片的输出，将图片输出到train和test两个文件夹下，并且对图片进行重命名

%  同时给所有图片打标签，存于test_labels.txt   trainlabels.txt

%

%

clear

rand('seed',1);

datadir = ('D:\matconvnet-beta23\data\chars74K\Fnt');   % 原数据集所在路径

catedir=dir(datadir);                                   % 获取数据集下信息

trainratio = 0.8;                                       % 百分之八十训练

train_labels= fopen('train_labels.txt','wt');           % 创建标签文件

test_labels = fopen('test_labels.txt','wt');

class_num = 0 ;                                         % 记录类别

for i =3:length(catedir)

    sampdir=dir(fullfile(datadir,catedir(i).name,'\*.png'));             %    获取类文件夹下 png图片，

    disp(['category ',  num2str(i-2) , ' have ', num2str(length(sampdir)),'instance.']); 

        new_folder_train = ['./train/',catedir(i).name];  % 创建各类文件夹，按第i类创建

        new_folder_test = ['./test/',catedir(i).name];

        mkdir(new_folder_train);

        mkdir(new_folder_test);

        class_num =class_num + 1;

        for j = 1:length(sampdir)

            if j==1

              krand = randperm(length(sampdir));   % 随机选取图片，防止过拟合

            end

            kk = krand(j);

            img = imread(fullfile(datadir,catedir(i).name,sampdir(j).name)); %  读取

            name = [catedir(i).name,'\',sampdir(kk).name];      % 输出每张图片的名称 

            if j < length(sampdir) *trainratio                 % j是读取的第j个样本（子类中）,j小于**时，设置为1，1是表示训练

                imwrite(img,[new_folder_train,'/',sampdir(kk).name]); %  注 ：‘.png’

                fprintf(train_labels,'%s %s\n',name,num2str(class_num-1));      % 从0开始编号，写label的txt文件

                else

                imwrite(img,[new_folder_test,'/',sampdir(kk).name]);

                fprintf(test_labels,'%s %s\n',name,num2str(class_num-1));       % 从0开始编号

            end

            disp(['category ',  num2str(i-2) , ' have ', num2str(length(sampdir)-2),' sample.  '  ...

                  'sample ',  ' ------ ', num2str(j) ]);

        end

end

fclose(train_labels);

fclose(test_labels);

来看看生成的文件，此处将数据存于caffe-master\data\Chars74k下，因此train和test文件夹是在caffe-master\data\Chars74k下。

如图所示，train文件夹里有62个子文件夹，分别代表62个类别，每个子文件夹里就是图片。Test文件夹同理。

如图所示，这训练集的标签文件，分两个部分。第一部分是路径，此处要注意， “Sample001\img001-00051.png ” 要与train文件夹里的图片的文件名一一对应，否则在用convert_imageset.exe进行转换格式时候会出现找不到文件的提示。
（PS：我直接就是在matlab中输出图片时，多加了’.png’，导致图片的文件名是 Sample001\img001-00051.png.png 最终导致找不到文件）
第二部分就是标签了，这里的标签是从0开始表示第一个类别。特别注意，txt文件中，文件路径和标签中有一个空格。

第二步

有了train和test以及对应标签文件，就可以利用 convert_imageset.exe将图片转换成LMDB或者LEVELDB的格式，这里采用批处理的方式。首先在caffe-master\data\Chars74k 文件夹下创建txt文件重命名为：convert_chars74k_LMDB.bat
一定要把后缀改成 .bat ，然后将以下代码复制到文本中，保存。

D:\caffe-master\Build\x64\Release\convert_imageset.exe --resize_width= --resize_height=   ./train/ train_labels.txt  train_lmdb -backend=lmdb

D:\caffe-master\Build\x64\Release\convert_imageset.exe --resize_width= --resize_height=   ./test/ test_labels.txt  test_lmdb -backend=lmdb

Pause

这里的每行包含七个部分，第一个部分：D:\caffe-master\Build\x64\Release\convert_imageset.exe 表示 convert_imageset.exe所在路径（PS，若是用Debug生成的，则在将Release改成Debug即可）
第二、三部分，是对原始图片进行了resize，第四部分：
./train/ 是训练图片文件所在路径，此处用了相对路径的形式（不了解相对路径的同学，请度娘 ./ ../的作用）第五部分，train_labels.txt是训练集的标签
第六部分：train_lmdb 是生成LMDB格式文件的文件名
第七部分：-backend=lmdb 是所要转成的格式（要转成 leveldb的则改成 -backend=leveldb）
然后双击运行convert_chars74k_LMDB.bat

运行正常的话，在文件夹caffe-master\data\Chars74k下会出现
test_lmdb 和train_lmdb 两个文件夹。至此，已经将自己的数据集转换成为LMDB格式的数据了，即caffe可读的数据格式。

第三步

训练
此处和训练Mnist和Cifar-10一样可参考（http://blog.csdn.net/u011995719/article/details/53998331）
训练需要写两个prototxt文件，一个是描述网络结构的，一个是超参数的设定。

如图所示，一个是网络模型描述，一个是超参数设置，特别注意路径。

写好这两个文件之后，就可以利用caffe.exe进行训练啦。
在文件夹caffe-master\data\Chars74k下，创建txt文件，重命名为caffe_train_Chars74k.bat（注意改后缀），然后复制以下代码：

..\..\Build\x64\Release\caffe.exe train --solver=./Chars74k_solver.prototxt

Pause

同样的，注意路径就好。保存之后，双击运行即可。

【caffe-windows】 caffe-master 之训练自己数据集（图片转换成lmdb or leveldb）的更多相关文章

caffe 图片数据的转换成lmdb和数据集均值（转）
转自网站: http://blog.csdn.net/muyiyushan/article/details/70578077 1.准备数据使用dog/cat数据集,在训练项目根目录下分别建立trai ...
Caffe：如何将图片数据转换成lmdb文件
1 图片信息的转换在caffe中经常使用的数据类型是lmdb或leveldb;不是常见的jpg,jpeg,png,tif等格式;因此,需要进行格式转换,通过输入你自己的图片目录(下有的大量图片)转换 ...
7.caffe：create_lmdb.sh（数据预处理转换成lmdb格式）
个人实践代码如下: #!/usr/bin/env sh # Create the imagenet lmdb inputs # N.B. set the path to the imagenet tr ...
调用caffe脚本将图片转换为了lmdb格式
#!/usr/bin/env sh # Create the imagenet lmdb inputs # N.B. set the path to the imagenet train + val ...
ubuntu16.04+caffe训练mnist数据集
1. caffe-master文件夹权限修改下载的caffe源码编译的caffe-master文件夹貌似没有写入权限,输入以下命令修改: sudo chmod -R 777 ~/caffe-ma ...
windows+caffe(三)——求取图片的均值
这个要在图片已经转化成lmdb格式下才能求均值... 1.查看caffe根目录下的bin是否存在compute_image_mean.exe(用的happey大神的) 如果没有存在,你需要打开Main ...
caffe(9) caffe例子
为了程序的简洁,在caffe中是不带练习数据的,因此需要自己去下载.但在caffe根目录下的data文件夹里,作者已经为我们编写好了下载数据的脚本文件,我们只需要联网,运行这些脚本文件就行了. 注意: ...
实践详细篇-Windows下使用VS2015编译的Caffe训练mnist数据集
上一篇记录的是学习caffe前的环境准备以及如何创建好自己需要的caffe版本.这一篇记录的是如何使用编译好的caffe做训练mnist数据集,步骤编号延用上一篇 <实践详细篇-Windows下 ...
Caffe初试（二）windows下的cafee训练和测试mnist数据集
一.mnist数据集 mnist是一个手写数字数据库,由Google实验室的Corinna Cortes和纽约大学柯朗研究院的Yann LeCun等人建立,它有60000个训练样本集和10000个测试 ...

随机推荐

lua和c的亲密接触
介绍 lua和c的亲密接触,靠的是一个虚拟栈.lua通过这个虚拟栈来实现和c之间值的互传.栈上的每一个元素是一个lua值(nil,number,string...). 当lua调用c函数的时候,这个函 ...
实现自动构建编译javaweb项目并发布到N台服务器
前言当你使用nginx实现了负载均衡,当你有了超过3台以上的应用服务器时,一个特别头疼的问题就来了,发布项目好麻烦. 你每次都要在本地编译打包一遍,然后手动复制到每一台服务器上面去,如果只有一两台服 ...
UI 自定义视图 ,视图管理器
一>自定义label - textField 视图自定义视图:系统标准UI之外,自己组合而出的新的视图 iOS 提供了很多UI组件 ,借助它们,我们可以做各种程序尽管如此,实际开发中,我们还 ...
Android中的WebView实战详解（二）
四.如何用WebView下载软件? 四.如何用WebView下载软件? public class MainActivity extends AppCompatActivity { private We ...
.Net程序员学用Oracle系列(22)：分析函数(OVER)
1.函数语法 1.1.语法概述 1.2.窗口详解 1.2.1.ROWS 窗口 1.2.2.RANGE 窗口 2.函数用法 2.1.普通统计类函数 2.2.数据排序类函数 2.3.数据分布类函数 2.4 ...
SQL注入相关的知识【Mysql为例子】
以DVWA的sql注入初级为例,结合网上搜索的相关利用方式,总结成这一篇文章,内容会有点跳跃. 大纲: 1.初级手工注入 2.order by的使用 3.union查询注意点 4.Mysql相关的注释 ...
windows phone 8.1 开发:后台任务详解
原文出自:http://www.bcmeng.com/backtask/ 小梦今天给大家分享一下windows phone 8.1中的后台任务如何实现,许多应用都会用到后台任务,所以我们必须得掌握. ...
关于npm安装全局模块，require时报Error: Cannot find module 'XXX'的解决办法
系统环境:centos 下午使用npm安装"cheerio",想搞爬虫玩玩. npm安装有两种模式: 本地 # npm install cheerio 全局 # npm insta ...
php人员权限管理(RBAC)
在说权限管理前,应该先知道权限管理要有哪些功能: (1).用户只能访问,指定的控制器,指定的方法 (2).用户可以存在于多个用户组里 (3).用户组可以选择,指定的控制器,指定的方法 (4).可以添 ...
lsb_release 命令找不到
yum install redhat-lsb -y 参考:http://blog.chinaunix.net/uid-20606164-id-3485376.html

【caffe-windows】 caffe-master 之 训练自己数据集（图片转换成lmdb or leveldb）

第一步

【caffe-windows】 caffe-master 之 训练自己数据集（图片转换成lmdb or leveldb）的更多相关文章

随机推荐

热门专题

【caffe-windows】 caffe-master 之训练自己数据集（图片转换成lmdb or leveldb）

【caffe-windows】 caffe-master 之训练自己数据集（图片转换成lmdb or leveldb）的更多相关文章