caffe简易上手指南（二）—— 训练我们自己的数据

训练我们自己的数据

本篇继续之前的教程，下面我们尝试使用别人定义好的网络，来训练我们自己的网络。

1、准备数据

首先很重要的一点，我们需要准备若干种不同类型的图片进行分类。这里我选择从ImageNet上下载了3个分类的图片（Cat，Dog，Fish）。

图片需要分两批：训练集（train）、测试集（test），一般训练集与测试集的比例大概是5:1以上，此外每个分类的图片也不能太少，我这里每个分类大概选了5000张训练图+1000张测试图。

找好图片以后，需要准备以下文件：

words.txt：分类序号与分类对应关系（注意：要从0开始标注）

0 cat

1 dog

2 fish

train.txt：标明训练图片路径及其对应分类，路径和分类序号直接用空格分隔，最好随机打乱一下图片

/opt/caffe/examples/my_simple_image/data/cat_train/n02123045_4416.JPEG 0

/opt/caffe/examples/my_simple_image/data/cat_train/n02123045_3568.JPEG 0

/opt/caffe/examples/my_simple_image/data/fish_train/n02512053_4451.JPEG 2

/opt/caffe/examples/my_simple_image/data/cat_train/n02123045_3179.JPEG 0

/opt/caffe/examples/my_simple_image/data/cat_train/n02123045_6956.JPEG 0

/opt/caffe/examples/my_simple_image/data/cat_train/n02123045_10143.JPEG 0
......

val.txt：标明测试图片路径及其对应分类

/opt/caffe/examples/my_simple_image/data/dog_val/n02084071_12307.JPEG 1

/opt/caffe/examples/my_simple_image/data/dog_val/n02084071_10619.JPEG 1

/opt/caffe/examples/my_simple_image/data/cat_val/n02123045_13360.JPEG 0

/opt/caffe/examples/my_simple_image/data/cat_val/n02123045_13060.JPEG 0

/opt/caffe/examples/my_simple_image/data/cat_val/n02123045_11859.JPEG 0
......

2、生成lmdb文件

lmdb是caffe使用的一种输入数据格式，相当于我们把图片及其分类重新整合一下，变成一个数据库输给caffe训练。

这里我们使用caffenet的create_imagenet.sh文件修改，主要是重新指定一下路径：

EXAMPLE=examples/my_simple_image/

DATA=examples/my_simple_image/data/

TOOLS=build/tools

TRAIN_DATA_ROOT=/

VAL_DATA_ROOT=/

# 这里我们打开resize，需要把所有图片尺寸统一

RESIZE=true

if $RESIZE; then

  RESIZE_HEIGHT=256

  RESIZE_WIDTH=256

else

  RESIZE_HEIGHT=0

  RESIZE_WIDTH=0

fi

.......

echo "Creating train lmdb..."

GLOG_logtostderr=1 $TOOLS/convert_imageset \

    --resize_height=$RESIZE_HEIGHT \

    --resize_width=$RESIZE_WIDTH \

    --shuffle \

    $TRAIN_DATA_ROOT \

    $DATA/train.txt \

    $EXAMPLE/ilsvrc12_train_lmdb　　#生成的lmdb路径

echo "Creating val lmdb..."

GLOG_logtostderr=1 $TOOLS/convert_imageset \

    --resize_height=$RESIZE_HEIGHT \

    --resize_width=$RESIZE_WIDTH \

    --shuffle \

    $VAL_DATA_ROOT \

    $DATA/val.txt \

    $EXAMPLE/ilsvrc12_val_lmdb    #生成的lmdb路径

echo "Done."

3、生成mean_file

下面我们用lmdb生成mean_file，用于训练（具体做啥用的我还没研究。。。）

这里也是用imagenet例子的脚本：

EXAMPLE=examples/my_simple_image

DATA=examples/my_simple_image

TOOLS=build/tools

$TOOLS/compute_image_mean $EXAMPLE/ilsvrc12_train_lmdb $DATA/imagenet_mean.binaryproto

echo "Done."

4、修改solver、train_val配置文件

这里我们可以选用cifar的网络，也可以用imagenet的网络，不过后者的网络结构更复杂一些，为了学习，我们就用cifar的网络来改。

把cifar的两个配置文件拷过来：

cifar10_quick_solver.prototxt
cifar10_quick_train_test.prototxt

首先修改cifar10_quick_train_test.prototxt的路径以及输出层数量（标注出黑体的部分）：

name: "CIFAR10_quick"

layer {

  name: "cifar"

  type: "Data"

  top: "data"

  top: "label"

  include {

    phase: TRAIN

  }

  transform_param {

    mean_file: "examples/my_simple_image/imagenet_mean.binaryproto"

  }

  data_param {
    source: "examples/my_simple_image/ilsvrc12_train_lmdb"

    batch_size: 50    #一次训练的图片数量，一般指定50也够了

    backend: LMDB

  }

}

layer {

  name: "cifar"

  type: "Data"

  top: "data"

  top: "label"

  include {

    phase: TEST

  }

  transform_param {

    mean_file: "examples/my_simple_image/imagenet_mean.binaryproto"

  }

  data_param {

    source: "examples/my_simple_image/ilsvrc12_val_lmdb"

    batch_size: 50    #一次训练的图片数量

    backend: LMDB

  }

}


..........

layer {

  name: "ip2"

  type: "InnerProduct"

  bottom: "ip1"

  top: "ip2"

  ..........

  inner_product_param {

    num_output: 3      #输出层数量，就是你要分类的个数

    weight_filler {

      type: "gaussian"

      std: 0.1

    }

    bias_filler {

      type: "constant"

    }

  }

}

......

cifar10_quick_solver.prototxt的修改根据自己的实际需要：

net: "examples/my_simple_image/cifar/cifar10_quick_train_test.prototxt"   #网络文件路径
test_iter: 20        #测试执行的迭代次数
test_interval: 10    #迭代多少次进行测试

base_lr: 0.001       #迭代速率，这里我们改小了一个数量级，因为数据比较少

momentum: 0.9

weight_decay: 0.004

lr_policy: "fixed"   #采用固定学习速率的模式display: 1           #迭代几次就显示一下信息，这里我为了及时跟踪效果，改成1

max_iter: 4000       #最大迭代次数

snapshot: 1000       #迭代多少次生成一次快照

snapshot_prefix: "examples/my_simple_image/cifar/cifar10_quick"     #快照路径和前缀

solver_mode: CPU     #CPU或者GPU

5、开始训练

运行下面的命令，开始训练（为了方便可以做成脚本）

./build/tools/caffe train --solver=examples/my_simple_image/cifar/cifar10_quick_solver.prototxt

6、小技巧

网络的配置和训练其实有一些小技巧。

- 训练过程中，正确率时高时低是很正常的现象，但是总体上是要下降的

- 观察loss值的趋势，如果迭代几次以后一直在增大，最后变成nan，那就是发散了，需要考虑减小训练速率，或者是调整其他参数

- 数据不能太少，如果太少的话很容易发散

caffe简易上手指南（二）—— 训练我们自己的数据的更多相关文章

caffe简易上手指南（一）—— 运行cifar例子
简介 caffe是一个友好.易于上手的开源深度学习平台,主要用于图像的相关处理,可以支持CNN等多种深度学习网络. 基于caffe,开发者可以方便快速地开发简单的学习网络,用于分类.定位等任务,也可以 ...
caffe简易上手指南（三）—— 使用模型进行fine tune
之前的教程我们说了如何使用caffe训练自己的模型,下面我们来说一下如何fine tune. 所谓fine tune就是用别人训练好的模型,加上我们自己的数据,来训练新的模型.fine tune相当于 ...
NewLife.XCode 上手指南2018版（二）增
目录 NewLife.XCode 上手指南2018版(一)代码生成 NewLife.XCode 上手指南2018版(二)增 NewLife.XCode 上手指南2018版(三)查 NewLife.XC ...
实践详细篇-Windows下使用Caffe训练自己的Caffemodel数据集并进行图像分类
三:使用Caffe训练Caffemodel并进行图像分类上一篇记录的是如何使用别人训练好的MNIST数据做训练测试.上手操作一边后大致了解了配置文件属性.这一篇记录如何使用自己准备的图片素材做图像分 ...
Resharper上手指南
原文http://www.cnblogs.com/renji/archive/2007/12/11/resharper.html Resharper上手指南我是visual studio的忠实用户, ...
NewLife.XCode 上手指南2018版（一）代码生成
目录 NewLife.XCode 上手指南2018版(一)代码生成 NewLife.XCode 上手指南2018版(二)增 NewLife.XCode 上手指南2018版(三)查 NewLife.XC ...
Gatsby上手指南 - 让你的静态网站用react来高逼格的写
注意:Gatsby V2版本安装及使用问题请移步<Gastby V2安装过程中常见问题>,此文较旧,主要针对V1版Gatsby而介绍前言一直以来都是用之前比较流行的静态网站生成器Hex ...
Caffe学习系列(12)：训练和测试自己的图片--linux平台
Caffe学习系列(12):训练和测试自己的图片学习caffe的目的,不是简单的做几个练习,最终还是要用到自己的实际项目或科研中.因此,本文介绍一下,从自己的原始图片到lmdb数据,再到训练和测 ...
Ubuntu16.04下caffe CPU版的图片训练和测试
一数据准备二.转换为lmdb格式 1.首先,在examples下面创建一个myfile的文件夹,来用存放配置文件和脚本文件.然后编写一个脚本create_filelist.sh,用来生成train ...

随机推荐

关联 Android 源代码到 Ecplise
1. 下载android 源码存于本地硬盘; 2. 打开Eclpise, 新建Android Project; 3. 在MainActivity文件中,按住Ctrl 点击Activity类 4. 弹出 ...
SQL 远程过程调用失败【0x800706be】或正在关闭【0x80041033】解决方法
在SQL Server 配置管理器中出现[远程过程调用失败.[0x800706be]]或者[正在关闭 [0x80041033]]错误,如图所示上网查找发现时SQL2008与VS2012或VS2013 ...
3.IP转发
1. "vim /usr/lib/sysctl.d/00-system.conf"在#Disable netfilter on bridges.栏下面添加行:"net. ...
《APUE》第6章笔记
这一章主要介绍了口令文件和组文件的结构和一些围绕这些结构的函数. 口令文件即passwd就是在/etc/passwd中可以查阅.其结构是: 上图四个平台能支持的就用黑点表示. 因为加密口令这一项放在p ...
【转】DataGridView绑定数据源的几种方式
第一种:DataSet ds=new DataSet (); this.dataGridView1.DataSource=ds.Table[0]; 第二种:DataTable dt=new DataT ...
log4net基本日志使用笔记[windows application]
Ref: http://www.cnblogs.com/wangsaiming/archive/2013/01/11/2856253.html http://www.cnblogs.com/zhouf ...
[Testing] 測試電子原文書
測試電子原文書 http://files.cnblogs.com/vincentmylee/SoftwareTesting2ndEdition.7z
Microsoft Expression Blend 4制作简单的按钮
在博客园混了这么久了,第一次写博客.本人标准的理工男,文笔不敢说一般,只能用还学过语文.勉强达意而已.见笑!! 由于本人能有有限,错误之处在所难免,望大牛们批评指正,共同进步.^_^!!!!!!!!! ...
（转）Memcached
Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载.它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提供动态.数据库驱动网站的速度.Memcache ...
php使用注意点
php使用时间之前要将php.ini中时区设置好,否则会报警告.截图如下:“;date.timezone =”设置为“date.timezone =Asia/Shanghai”即可. apache如果 ...

caffe简易上手指南（二）—— 训练我们自己的数据

caffe简易上手指南（二）—— 训练我们自己的数据的更多相关文章

随机推荐

热门专题