caffe的输入

决定将caffe分为几个部分进行总结，首先是第一部分，输入数据以及输入层。

首先从输入数据对BP的影响开始介绍。

sgd的随机性

由于是sgd，因此样本一定要shuffle。BP中说到，样本选择遵循俩个原则：1.shuffle，让样本囊括所有类，2. 使得误差大的样本多出现，而误差小的少出现。

首先说一说第一个：

随机性，这个在caffe中都是怎么体现的呢？先说说caffe中的输入格式吧，leveldb, image原始数据，hdf5,lmdb。其中对应的类有data_layer, image_data_layer,windows_data_layer,hdf5_data_layer。使用leveldb作为输入的层，在打leveldb时已经shuffle过了，一定要选择要随机打leveldb，否则模型无法训练的。而用image原始数据作为输入的层，在读入数据列表后，image_Data_layer会先进行整体shuffle，然后再进行训练。而window_data_layer，首先读取数据列表，然后在训练过程中，读取数据时，每次读的数据时随机的。而hdf5和lmdb，我没有打过hdf5,lmdb，等我调查后再补充，从代码来看，应该在打hdf5时就要随机的。

第二点呢，这个其实在caffe里我没有看到相关的应用，我想可能主要是因为caffe主要是针对大数据训练的（咳咳，现在说到大数据我就别扭，连什么什么会都开始什么都冠名“大”了，太俗了）。在这种情况下，想要记录每一个训练样本的误差，是基本上无法实现的，而且当数据量大了，也不需要去在乎这个了。但是，这个训练策略是值得一提的，在SVM的训练中，用到的是hard negative minning，就是这个原理，或者差不多吧。在SVM的训练过程中，每次都是选择那些分错的从新训练，而分对的不需要再进行。具体理论保证，我好想又忘记了……

本小题未完待续，最近系统看关于fp,bp的文章，efficient bp我第三次看，还是白板一样，全是新知识扑面而来。

caffe的输入的更多相关文章

caffe卷积输入通道如何到输出通道
今天一个同学问卷积过程好像是对一个通道的图像进行卷积, 比如10个卷积核,得到10个feature map, 那么输入图像为RGB三个通道呢,输出就为 30个feature map 吗, 答案肯定 ...
c++ 和 matlab 下的caffe模型输入差异
在向一个caffe模型传递输入数据的时候,要注意以下两点: 1. opencv中Mat数据在内存中的存放方式是按行存储,matlab中图像在内存中的存放方式是按列存储. 2. opencv中Mat数据 ...
caffe添加自己的数据输入层
整体思路: 阅读caffe数据输入层各个类之间的继承关系,确定当前类需要继承的父类以及所需参数的设置. 编写zzq_data.cpp 在layer_factory.cpp中完成注册: 在caffe.p ...
Caffe学习笔记（三）：Caffe数据是如何输入和输出的？
Caffe学习笔记(三):Caffe数据是如何输入和输出的? Caffe中的数据流以Blobs进行传输,在<Caffe学习笔记(一):Caffe架构及其模型解析>中已经对Blobs进行了简 ...
Caffe训练好的网络对图像分类
对于训练好的Caffe 网络输入:彩色or灰度图片做minist 下手写识别分类,不能直接使用,需去除均值图像,同时将输入图像像素归一化到0-1直接即可. #include <caffe/c ...
（原）caffe中fine tuning及使用snapshot时的sh命令
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/5946041.html 参考网址: http://caffe.berkeleyvision.org/tu ...
总结一下用caffe跑图片数据的研究流程
近期在用caffe玩一些数据集,这些数据集是从淘宝爬下来的图片.主要是想研究一下对女性衣服的分类. 以下是一些详细的操作流程,这里总结一下. 1 爬取数据.写爬虫从淘宝爬取自己须要的数据. 2 数据预 ...
windows下用c++调用caffe做前向
参考博客: https://blog.csdn.net/muyouhang/article/details/54773265 https://blog.csdn.net/hhh0209/article ...
TensorRT加速 ——NVIDIA终端AI芯片加速用，可以直接利用caffe或TensorFlow生成的模型来predict（inference）
官网:https://developer.nvidia.com/tensorrt 作用:NVIDIA TensorRT™ is a high-performance deep learning inf ...

随机推荐

qt安装
在以下网页选择一个国内的下载地址即可 http://download.qt.io/official_releases/qt/5.7/5.7.0/qt-opensource-linux-x64-5.7. ...
二叉查找树的C语言实现（二）
接着上次的话题.这次我们要讨论,二叉查找树的中序遍历和后序遍历(递归和非递归),另外还有先序遍历(非递归) 1.中序遍历(递归) static void __in_order(struct bnode ...
for循环笔记
JS获取元素方法——ById和ByTagName方法的区别 1.通过id获取,前面就只能是document,不能是其他的,但是ByTagName前面可以是document,也可以跟一个别的元素 #li ...
HDU 4578——Transformation——————【线段树区间操作、确定操作顺序】
Transformation Time Limit: 15000/8000 MS (Java/Others) Memory Limit: 65535/65536 K (Java/Others)T ...
js删除数组里指定的元素
js删除数组里指定的元素首先可以给JS的数组对象定义一个函数,用于查找指定的元素在数组中的位置,即索引,代码为: Array.prototype.indexOf = function(val) { ...
MySQL锁行锁表
select..for update; 给数据库表手动上锁 --锁行Begin; for update; --给 id=1 的行加上排它锁且 id 有索引 ; Commit; -- 锁表 BEGIN; ...
#include stdio.h(7)
#include <stdio.h> int main() { //***********一.循环语句*************** //什么叫做循环: //重复的做某件事情,重复的执行一 ...
Java—多态
多态——对象的多种形态(继承是多态实现的基础) 引用多态:父类的引用可以指向本类的对象:父类的引用可以指向子类的对象方法多态:创建本类对象时,调用的方法为本类方法:创建子类对象时,调用的方法为子类重 ...
springboot 修改和设置 banner
springboot 修改和设置 banner 先上图修改步骤 1.在src/main/resources下新建一个banner.txt文档 2.通过http://patorjk.com/softw ...
Lucene学习入门——核心类API
本文讲解Lucene中,创建索引.搜索等常用到的类API 搜索操作比索引操作重要的多,因为索引文件只被创建一次,却要被搜索多次. 索引过程的核心类: 执行简单的索引过程需要如下几个类:IndexWri ...

caffe的输入

caffe的输入的更多相关文章

随机推荐

热门专题