【Caffe篇】--Caffe solver层从初始到应用

一、前述

solve主要是定义求解过程，超参数的

二、具体

#往往loss function是非凸的，没有解析解,我们需要通过优化方法来求解。

#caffe提供了六种优化算法来求解最优参数，在solver配置文件中，通过设置type类型来选择。

    Stochastic Gradient Descent (type: "SGD"),

    AdaDelta (type: "AdaDelta"),

    Adaptive Gradient (type: "AdaGrad"),

    Adam (type: "Adam"),

    Nesterov’s Accelerated Gradient (type: "Nesterov") and

    RMSprop (type: "RMSProp")

net: "examples/mnist/lenet_train_test.prototxt"  #网络配置文件位置

test_iter: 100

test_interval: 500

base_lr: 0.01#基础学习率

momentum: 0.9

type: SGD

weight_decay: 0.0005

lr_policy: "inv"

gamma: 0.0001

power: 0.75

display: 100

max_iter: 20000

snapshot: 5000

snapshot_prefix: "examples/mnist/lenet"

solver_mode: CPU

net: "examples/mnist/lenet_train_test.prototxt" #网络位置

train_net: "examples/hdf5_classification/logreg_auto_train.prototxt" #也可以分别设定train和test

test_net: "examples/hdf5_classification/logreg_auto_test.prototxt"

test_iter: 100 #迭代了多少个测试样本呢？ batch*test_iter 假设有5000个测试样本，一次测试想跑遍这5000个则需要设置test_iter×batch=5000

test_interval: 500 #测试间隔。也就是每训练500次，才进行一次测试。

base_lr: 0.01 #base_lr用于设置基础学习率

lr_policy: "inv" #学习率调整的策略 希望学习率越来越小

        - fixed:　　 保持base_lr不变.

        - step: 　　 如果设置为step,则还需要设置一个stepsize,  返回 base_lr * gamma ^ (floor(iter / stepsize)),其中iter表示当前的迭代次数

        - exp:   　　返回base_lr * gamma ^ iter， iter为当前迭代次数

        - inv:　　    如果设置为inv,还需要设置一个power, 返回base_lr * (1 + gamma * iter) ^ (- power)

        - multistep: 如果设置为multistep,则还需要设置一个stepvalue。这个参数和step很相似，step是均匀等间隔变化，而multistep则是根据                                             stepvalue值变化

        - poly: 　　  学习率进行多项式误差, 返回 base_lr (1 - iter/max_iter) ^ (power)

        - sigmoid:　学习率进行sigmod衰减，返回 base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))

momentum ：0.9 #动量 一般是固定为0.9

display: 100 #每训练100次，在屏幕上显示一次。如果设置为0，则不显示。

max_iter: 20000 #最大迭代次数，2W次就停止了

snapshot: 5000 #快照。将训练出来的model和solver状态进行保存，snapshot用于设置训练多少次后进行保存

snapshot_prefix: "examples/mnist/lenet" 

solver_mode: CPU #设置运行模式。默认为GPU,如果你没有GPU,则需要改成CPU,否则会出错。

【Caffe篇】--Caffe solver层从初始到应用的更多相关文章

Caffe源代码中Solver文件分析
Caffe源代码(caffe version commit: 09868ac , date: 2015.08.15)中有一些重要的头文件,这里介绍下include/caffe/solver.hpp文件 ...
caffe实现自己的层
http://blog.csdn.net/xizero00/article/details/52529341 将这篇博客所讲进行了实现 1.LayerParameter也在caffe.proto文件中 ...
【撸码caffe四】 solver.cpp&&sgd_solver.cpp
caffe中solver的作用就是交替低啊用前向(forward)算法和后向(backward)算法来更新参数,从而最小化loss,实际上就是一种迭代的优化算法. solver.cpp中的Solver ...
【撸码caffe 五】数据层搭建
caffe.cpp中的train函数内声明了一个类型为Solver类的智能指针solver: // Train / Finetune a model. int train() { -- shared_ ...
Caffe源码-Solver类
Solver类简介 Net类中实现了网络的前向/反向计算和参数更新,而Solver类中则是对此进行进一步封装,包含可用于逐次训练网络的Step()函数,和用于求解网络的优化解的Solve()函数,同时 ...
caffe win添加新层
1.编写.h和.cpp .cu文件将.hpp文件放到路径caffe-windows\caffe-master\include\caffe\layers下将.cpp文件和.cu放到路径caffe-w ...
caffe添加python数据层
caffe添加python数据层(ImageData) 在caffe中添加自定义层时,必须要实现这四个函数,在C++中是(LayerSetUp,Reshape,Forward_cpu,Backward ...
caffe实现focal loss层的一些理解和对实现一个layer层易犯错的地方的总结
首先要在caffe.proto中的LayerParameter中增加一行optional FocalLossParameter focal_loss_param = 205;,然后再单独在caffe. ...
caffe.bin caffe的框架
最近打算看一看caffe实现的源码,因为发现好多工作都是基于改动网络来实现自己的的目的.比如变更目标函数以及网络结构,以实现图片风格转化或者达到更好的效果. 深度学习框架 https://mp.wei ...

随机推荐

超实用的JavaScript代码段 Item2 --伸缩菜单栏
伸缩菜单栏点击标题时判断该标题下的菜单是否显示,如果是显示的则将其隐藏,如果是隐藏的则将其显示出来. <!doctype html> <html lang="en&quo ...
types.go
} type ChannelStatsList []*ChannelStats func (c ChannelStatsList) Len() int { return len(c) } func ( ...
Hibernate用注解生成表
User.java实体来 package com.tao.pojo; import javax.persistence.Column; //用注解的方式生成表 import javax.persist ...
将函数声明为Static的作用
表示静态函数,它为所有类共有的.调用该函数直接使用类名加上修饰符,如:Windows win;Windows::W_SIZE();而不是:win.W_SIZE();静态函数只能处理静态数据成员,不能处 ...
java EE 、java SE 、java ME的区别
hello spring春天来了
这是小小小零食废话不多说现在看到 spring这个管家先说第一个 ioc :在每个框架的中都有一个容器的概念,所谓的容器就是将常用的服务,封装起来,然后,用户只需要遵循一定的规则,就可以达到统 ...
（转载）CSS3与页面布局学习总结（三）——BFC、定位、浮动、7种垂直居中方法
目录一.BFC与IFC 1.1.BFC与IFC概要 1.2.如何产生BFC 1.3.BFC的作用与特点二.定位 2.2.relative 2.3.absolute 2.4.fixed 2.5.z- ...
JAVA基础第一章-初识java
业内经常说的一句话是不要重复造轮子,但是有时候,只有自己造一个轮子了,才会深刻明白什么样的轮子适合山路,什么样的轮子适合平地! 从今天开始,我将会持续更新java基础知识,欢迎关注. java的诞生 ...
LeetCode算法题-Number of Lines To Write String（Java实现）
这是悦乐书的第319次更新,第340篇原创 01 看题和准备今天介绍的是LeetCode算法题中Easy级别的第188题(顺位题号是806).我们要将给定字符串S的字母从左到右写成行.每行最大宽度为 ...
从壹开始微服务 [ DDD ] 之十一 ║ 基于源码分析，命令分发的过程（二）
缘起哈喽小伙伴周三好,老张又来啦,DDD领域驱动设计的第二个D也快说完了,下一个系列我也在考虑之中,是 Id4 还是 Dockers 还没有想好,甚至昨天我还想,下一步是不是可以写一个简单的Angu ...

【Caffe篇】--Caffe solver层从初始到应用

【Caffe篇】--Caffe solver层从初始到应用的更多相关文章

随机推荐

热门专题