Caffe solver.prototxt学习

在solver解决下面的四个问题：
a.训练的记录（bookkeeping），创建用于training以及test的网络结构；
b.使用前向以及反向过程对training网络参数学习的过程；
c.对testing网络进行评价；
d.优化过程中模型中间结果的快照及求解的状态；
下面从这个四个方面介绍solver.prototxt文件中常见参数的含义：
1.net，type;base_lr,lr_polilcy
net：用于声明training 以及test的网络结构定义在哪个文件中，所以它是一个文件名，一般用caffe的相对路径。这个还可以分开用train_net以及test_net，相当于在两个文件中分别给出了训练以及测试网络的结构定义。
type：solver的类型。深度网络的目标函数一般是非凸的，一般用基于梯度下降的方法来解。caffe中支持的基于梯度的方法包括： SGD(default),AdaDelt,AdaGrad,Adam,NAG.每个方法需要设定不同的参数，这里首先分析SGD的参数：
base_lr:学习率（learning rate），也就是梯度算法中的步长，这个是最初的步长。
lr_policy: 按照某种方式对梯度算法中的步长进行更新；包含下面的方式：fixed,step,exp,inv,multistep,poly,sigmoid对这些的详细描述可以参考这个很赞的blog. 这里描述常用的基于迭代次数的方式：step。她根据iter对步长进行更新，这种方式还对应一个stepsize参数,它的值是一个整数，表示stepsize次迭代对步长进行一次更新；公式为base_lr*gamma^(iter/stepsize）
gamma：这个参数就是在上面的公式中更新学习率的公式中用到的参数，要注意的是不同的方式有不同参数，有些方法中可能不存在这个参数。
momentum（mu）：它表示的是本次更新权重用的梯度对上一次梯度的保留的比例。
2.max_iter,display,weight_decay
max_iter:这个表示网络前向以及后向学习算法的次数。
display: 参数是一个整数，表明多少次对结果进行一此展示。如果设为0就不会打印。
weight_decay:权重正则项的参数，它是为了防止模型的过拟。通常而言，一般样本越多，值越小；模型越大（更深，滤波器尺寸越大等），值越大。
3.test_iter, test_interval：
test_iter:测试网络中测试的时候所用的batch数，一般保证test_iter*batch>测试样本数；
test_interval:每隔多少个iter对测试网络进行一个评价。
4.snapshot,snapshot_prefix.
snapshot：多少个iter保存一次网络的快照，这个有利于resume；
snapshot_prefix：快照存储的位置以及名称。
还可以设置snapshot_diff,snapshot_format.是否保存梯度值以及保存的类型。

Reference
[1]http://www.cnblogs.com/denny402/p/5074049.html
[2]http://stackoverflow.com/questions/32177764/what-is-weight-decay-meta-parameter-in-caffe?noredirect=1&lq=1
[3]http://caffe.berkeleyvision.org/tutorial/solver.html

Caffe solver.prototxt学习的更多相关文章

caffe solver.prototxt 生成
from caffe.proto import caffe_pb2 s = caffe_pb2.SolverParameter() path='/home/xxx/data/' solver_file ...
4.caffe：train_val.prototxt、 solver.prototxt 、 deploy.prototxt（创建模型与编写配置文件）
一,train_val.prototxt name: "CIFAR10_quick" layer { name: "cifar" type: "Dat ...
caffe之solver.prototxt文件参数设置
caffe solver参数意义与设置 batchsize:每迭代一次,网络训练图片的数量,例如:如果你的batchsize=256,则你的网络每迭代一次,训练256张图片:则,如果你的总图片张数为1 ...
caffe 参数介绍 solver.prototxt
转载自 http://blog.csdn.net/cyh_24/article/details/51537709 solver.prototxt net: "models/bvlc_alex ...
caffe源码学习之Proto数据格式【１】
前言: 由于业务需要,接触caffe已经有接近半年,一直忙着阅读各种论文,重现大大小小的模型. 期间也总结过一些caffe源码学习笔记,断断续续,这次打算系统的记录一下caffe源码学习笔记,巩固一下 ...
caffe solver 配置详解
caffe solver通过协调网络前向推理和反向梯度传播来进行模型优化,并通过权重参数更新来改善网络损失求解最优算法,而solver学习的任务被划分为:监督优化和参数更新,生成损失并计算梯度.caf ...
caffe源码学习
本文转载自:https://buptldy.github.io/2016/10/09/2016-10-09-Caffe_Code/ Caffe简介 Caffe作为一个优秀的深度学习框架网上已经有很多内 ...
caffe solver configuration
(用到一个加一个, 并非完整的介绍) lr_policy 基本的learning rate 在solver.prototxt中由参数base_lr配置. 配合lr_policy和其余的一些参数制定le ...
【转】贾扬清：希望Caffe成为深度学习领域的Hadoop
[转:http://www.csdn.net/article/2015-07-07/2825150] 在深度学习(Deep Learning)的热潮下,Caffe作为一个高效.实用的深度学习框架受到了 ...

随机推荐

java exception 异常错误记录
//异常:Could not obtain transaction-synchronized Session for current thread 做定时器的时候用ApplicationContext ...
Jenkins介绍-安装-部署...
1.背景大师Martin Fowler对持续集成是这样定义的:持续集成是一种软件开发实践,即团队开发成员经常集成他们的工作,通常每个成员每天至少集成一次,也就意味着每天可能会发生多次集成. ...
转载：SoapUI之接口数据传递
SoapUI之接口数据传递(TestCase.TestSuite传递) SoapUI之接口数据传递(step传递) SoapUI+Groovy做接口自动化测试 SoapUI中使用Conditional ...
ES: 机器学习、专家系统、控制系统的数学映射
一.基本定义 1.机器学习维基定义:机器学习有下面几种定义: "机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能". & ...
Spring boot application.properties 配置
原文链接: http://docs.spring.io/spring-boot/docs/current/reference/html/common-application-properties.ht ...
RxSwift學習教程之基礎篇
前言我們在 iOS 開發過程中,幾乎無時無刻都要面對異步事件的處理.例如,按鍵點擊.數據保存..音頻後臺播放.交互動畫展示.這些事件並不具備特定時序性,甚至它們可能同時發生. 雖然 Apple 提供 ...
jquery里面控制显示和隐藏 ___土狗toggle
$("#hide").click(function(){ $("p").hide(); }); $("#show").click(funct ...
day03深浅拷贝、文件操作和函数初识
一.赋值.浅拷贝与深拷贝直接赋值:其实就是对象的引用(别名). 浅拷贝(copy):拷贝父对象,不会拷贝对象的内部的子对象. 深拷贝(deepcopy): copy 模块的 deepcopy 方法, ...
day28 re(正则)模块
目录 re模块有什么用? re模块的基础使用元字符终极贪婪模式非贪婪模式 re模块高级 comple match和search re.split() sub和subn 分组 re模块有什么用? ...
sql 注入例子及防止
一.什么是sql注入? 所谓SQL注入,就是通过把SQL命令插入到Web表单提交或输入域名或页面请求的查询字符串,最终达到欺骗服务器执行恶意的SQL命令二.sql例子 1.数字注入假设在项目中,在 ...

Caffe solver.prototxt学习

Caffe solver.prototxt学习的更多相关文章

随机推荐

热门专题