caffe简易上手指南（三）—— 使用模型进行fine tune

之前的教程我们说了如何使用caffe训练自己的模型，下面我们来说一下如何fine tune。

所谓fine tune就是用别人训练好的模型，加上我们自己的数据，来训练新的模型。fine tune相当于使用别人的模型的前几层，来提取浅层特征，然后在最后再落入我们自己的分类中。

fine tune的好处在于不用完全重新训练模型，从而提高效率，因为一般新训练模型准确率都会从很低的值开始慢慢上升，但是fine tune能够让我们在比较少的迭代次数之后得到一个比较好的效果。在数据量不是很大的情况下，fine tune会是一个比较好的选择。但是如果你希望定义自己的网络结构的话，就需要从头开始了。

这里采用一个实际的例子，钱币分类

1、我们收集了2W张图片，将其中4000张作为测试集，剩下作为训练集。

2、接着我们使用上一篇博客中的方法，生成words.txt、train.txt、test.txt三个文件，这里可以不用生成lmdb，因为caffe支持直接指定图片文件。

3、编辑配置文件，这里我们参考finetune_flickr_style例子（它是用caffenet的训练结果进行finetune的），拷贝其配置文件：

solver.prototxt

net: "examples/money_test/fine_tune/train_val.prototxt"

test_iter:

test_interval:

base_lr: 0.001

lr_policy: "step"

gamma: 0.1

stepsize:

display:

max_iter: 

momentum: 0.9

weight_decay: 0.0005

snapshot: 

snapshot_prefix: "examples/money_test/fine_tune/finetune_money"

solver_mode: CPU

train_val.prototxt

其实fine tune使用的网络跟原有网络基本一样，只不过每层调整了一些参数，具体可以参照finetune_flickr_style和caffenet网络配置的对比

name: "FlickrStyleCaffeNet"

layer {

  name: "data"

  type: "ImageData"

  top: "data"

  top: "label"

  include {

    phase: TRAIN

  }

  transform_param {

    mirror: true

    crop_size:

    mean_file: "data/ilsvrc12/imagenet_mean.binaryproto"

  }

  image_data_param {

    source: "examples/money_test/data/train.txt"

    batch_size:

    new_height:

    new_width:

  }

}

layer {

  name: "data"

  type: "ImageData"

  top: "data"

  top: "label"

  include {

    phase: TEST

  }

  transform_param {

    mirror: false

    crop_size:

    mean_file: "data/ilsvrc12/imagenet_mean.binaryproto"

  }

  image_data_param {

    source: "examples/money_test/data/test.txt"

    batch_size:

    new_height:

    new_width:

  }

}

..........

layer {

  name: "fc8_flickr"

  type: "InnerProduct"

  bottom: "fc7"

  top: "fc8_flickr"

  # lr_mult is set to higher than for other layers, because this layer is starting from random while the others are already trained

  param {

    lr_mult:

    decay_mult:

  }

  param {

    lr_mult:

    decay_mult:

  }

  inner_product_param {

    num_output: 17    #这里我们的分类数目

    weight_filler {

      type: "gaussian"

      std: 0.01

    }

    bias_filler {

      type: "constant"

      value:

    }

  }

}

.....

deploy.prototxt

用于实际分类时的网络

.........

layer {

  name: "fc8_flickr"

  type: "InnerProduct"

  bottom: "fc7"

  top: "fc8_flickr"

  # lr_mult is set to higher than for other layers, because this layer is starting from random while the others are already trained

  param {

    lr_mult:

    decay_mult:

  }

  param {

    lr_mult:

    decay_mult:

  }

  inner_product_param {

    num_output: 

    weight_filler {

      type: "gaussian"

      std: 0.01

    }

    bias_filler {

      type: "constant"

      value:

    }

  }

}

...........

4、开始训练

./build/tools/caffe train -solver examples/money_test/fine_tune/solver.prototxt -weights models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel

其中model指定的是caffenet训练好的model。

使用fine tune的效果比较好，经过3400多次迭代后，测试集上正确率达到92%，实际测试效果也比较理想。这也许就是深度学习的优势，不需要仔细地挑选特征，只要数据足够，也能得到不错的效果。

caffe简易上手指南（三）—— 使用模型进行fine tune的更多相关文章

caffe简易上手指南（一）—— 运行cifar例子
简介 caffe是一个友好.易于上手的开源深度学习平台,主要用于图像的相关处理,可以支持CNN等多种深度学习网络. 基于caffe,开发者可以方便快速地开发简单的学习网络,用于分类.定位等任务,也可以 ...
caffe简易上手指南（二）—— 训练我们自己的数据
训练我们自己的数据本篇继续之前的教程,下面我们尝试使用别人定义好的网络,来训练我们自己的网络. 1.准备数据首先很重要的一点,我们需要准备若干种不同类型的图片进行分类.这里我选择从ImageNet ...
UnityShader快速上手指南（三）
简介这一篇还是一些基本的shader操作:裁剪.透明和法向量的应用 (纠结了很久写不写这些,因为代码很简单,主要是些概念上的东西) 先来看下大概的效果图:(从左到右依次是裁剪,透明,加了法向量的透明 ...
Rancher 快速上手指南操作(1)
Rancher 快速上手指南操作(1)该指南知道用户如何快速的部署Rancher Server 管理容器.前提是假设你的机器已经安装好docker了.1 确认 docker 的版本,下面是 ubunt ...
Resharper上手指南
原文http://www.cnblogs.com/renji/archive/2007/12/11/resharper.html Resharper上手指南我是visual studio的忠实用户, ...
NewLife.XCode 上手指南2018版（二）增
目录 NewLife.XCode 上手指南2018版(一)代码生成 NewLife.XCode 上手指南2018版(二)增 NewLife.XCode 上手指南2018版(三)查 NewLife.XC ...
NewLife.XCode 上手指南2018版（一）代码生成
目录 NewLife.XCode 上手指南2018版(一)代码生成 NewLife.XCode 上手指南2018版(二)增 NewLife.XCode 上手指南2018版(三)查 NewLife.XC ...
[转]Rancher 快速上手指南操作(1)
本文转自:http://www.cppblog.com/zhiyewang/archive/2016/03/17/213053.aspx Rancher 快速上手指南操作(1)该指南知道用户如何快速的 ...
Caffe学习笔记（三）：Caffe数据是如何输入和输出的？
Caffe学习笔记(三):Caffe数据是如何输入和输出的? Caffe中的数据流以Blobs进行传输,在<Caffe学习笔记(一):Caffe架构及其模型解析>中已经对Blobs进行了简 ...

随机推荐

IE6下window.location.href不跳转到相应url
前天一同事遇到个看似很诡异的问题,就是<a href="javascript:void(0);" onclick="window.location.href=url ...
android SDK Manager更新不了,出现错误提示："Failed to fetch URL..."!
可以用以下办法解决: 使用SDK Manager更新时出现问题 Failed to fetch URL https://dl-ssl.google.com/android/repository/rep ...
1030. Travel Plan (30)
时间限制 400 ms 内存限制 65536 kB 代码长度限制 16000 B 判题程序 Standard 作者 CHEN, Yue A traveler's map gives the dista ...
C语言获取网页源代码的学习所得
研究了一天这个玩意感觉挺有意思的. 刚开始是什么都不懂,现在写出来一段代码感觉略微有点意思了. 下面我分享一下学习过程和自己的理解. 整体过程大概就是如下情况: 先搜了一下别人的写这个东西的代码. 研 ...
【BZOJ 2878】 [Noi2012]迷失游乐园
Description 放假了,小Z觉得呆在家里特别无聊,于是决定一个人去游乐园玩.进入游乐园后,小Z看了看游乐园的地图,发现可以将游乐园抽象成有n个景点.m条道路的无向连通图,且该图中至多有一个环( ...
div蒙版+可移动
<html> <head> <title></title> <script src="jquery-1.8.2.js&q ...
COUNT(*)与COUNT(列名)的区别（转）
COUNT(*)与COUNT(列名)的区别以前一直没有留意到COUNT(*)与COUNT(列名)的区别,昨天晚上无意中看到数据库系统工程师教程里面的一句话."如果null参与聚 ...
js原生removeclass方法
//如果列表中有存在给定的值就删除 // function removeClass(ele,txt){ // var str = ele.className, // ary = str.split(/ ...
bootstrap-treeview
简要教程 bootstrap-treeview是一款效果非常酷的基于bootstrap的jQuery多级列表树插件.该jQuery插件基于Twitter Bootstrap,以简单和优雅的方式来显示一 ...
ASP.NET MVC 数据分页思想及解决方案代码
作为一个程序猿,数据分页是每个人都会遇到的问题.解决方案更是琳琅满目,花样百出.但基本的思想都是差不多的. 下面给大家分享一个简单的分页器,让初学者了解一下最简单的分页思想,以及在ASP.NET MV ...

caffe简易上手指南（三）—— 使用模型进行fine tune

caffe简易上手指南（三）—— 使用模型进行fine tune的更多相关文章

随机推荐

热门专题