caffe 学习记录1及网络结构

ubuntu git clone 默认在当前文件夹

caffe 基础了解：https://www.zhihu.com/question/27982282/answer/39350629

当然，官网才是大牛：http://caffe.berkeleyvision.org/

Caffe支持三种数据格式输入网络，包括Image(.jpg, .png等)，leveldb，lmdb，根据自己需要选择不同输入吧。

深度学习结构剖析（错误纠正，（2）代表一个滤波器多个参数<->一个滤波器一个参数）

http://blog.csdn.net/zouxy09/article/details/8781543（原文）（实际上caffe并不这么做）这是我一直困惑的，被这个教程搞得一个星期头晕。caffe中所有输入特征子图和所有输出特征子图都相连。或许，以后直接从直观上思考这个问题，什么破连接，什么节点图，晕死！

http://www.cnblogs.com/tornadomeet/archive/2013/05/05/3061457.html（计算详细一文）

链接1的一个评论：再解释下C3的1516个权值是怎么来的。可以看这个博客http://www.cnblogs.com/tornadomeet/archive/2013/05/05/3061457.html
S2层有6个特征图，尺寸14*14。可以认为S2每个特征图是由14*14个共享权值的神经元输出的（等效为一个神经元卷积）。注意S2与C3不完全连接，C3的第一个特征图只与S2前三个特征图相连。具体看：C3里第一个特征图的一个神经元，与S2里第一个特征图的5*5神经元相连，同时也与第二个特征图的5*5相连，也与第三个特征图的5*5相连。因此C3第一个特征图的权值数为(5*5*3+1).
其实应该有个非常形象化的过程，就是三维卷积，你把S2层想成一个立方体，厚度为6，横截尺寸14*14, C3第一个特征图实际上是对这个立方体前三层的三维卷积。
再说连接数，C3第一个特征图里共享权值的神经元是10*10个，因此连接数是（5*5*3+1）*100

1516怎么来的？
（5*5*3+1）*6+（5*5*4+1）*9+（5*5*6+1）=1516
连接数，其实就是神经元复制了100次：
1516*100

看到下面有人说卷积核是60个，这个理解应该是把卷积只限制在S2的一个特征图上了，用三维卷积的角度考虑，卷积核实际上实在多特征图上进行，所以卷积核应该是16个
（用60个卷积核推导出的权值数和连接数还是1516和151600吗？？）

个人理解，如果错了恳求大家指出，我也好改正

按照链接2（good）：计算C5，由于全连接，故有，C5和S4中所有的挨个连，然后共加起来，再添加一个偏置，共（5*5*16+1）=401个参数，则120个共有120*401=48120个参数。当然，由于滤波器扫描移动是“1*1”，故连接数也是48120个。

按照链接2：F6的连接84（设计的），每个都全连接C5中120个特征子图（1*1），然后加起来，再添加一个偏置，共（1*1*120+1）=121个参数，则84个共有

84*121=10164个

注1：如此，输入相当于只有一个特征子图。

注2：最终经过一个sigmoid函数输出。还有什么径向基函数

总结思路：

参数计算：我的判别式如下表达式，其中L是上层C_k-1层的特征子图个数，F是滤波器参数个数，通常等于*×*，1是偏置，i代表本层C_k标号，共C个特征子图。L_ik指C_k层的第i个连接C_k-1层的特征子图个数。的求和指对所有标号求和，因为，不是全连接时，各个标号是不对称的，对应的参数也不一样。

（1）特殊地，对于pooling，通常F=1，L_ik=1，代表滤波器只有一个参数，F=1感受野的像素之后乘上一个权重，L=1代表pooling只可能与C_i-1有关。

（2）特殊地，对于第一数据输入层，L_ik=1

连接数的计算：我的判别式如下表达式，说明类似上面，多加一个M，代表C_k层每个滤波器在C_k-1层滑动的总步数，通常等于*×*。考虑可能滑动之后与滑动之前有部分重叠，也有可能不重叠。特殊地，M不使前后层重叠。对于pooling，通常F=1，L_ik=1，代表滤波器只有一个参数，F=1感受野的像素之后乘上一个权重，L_ik=1代表pooling只可能与C_k-1有关。

注意：

最后给出caffe作者的图文解释：http://www.zhihu.com/question/28385679

按照caffe中的结论，对比总结中的参数计算，Lik=上层特征子图数（通道数/输入个数）

caffe 学习记录1及网络结构的更多相关文章

caffe学习记录
结论: caffe网络的prototxt训练与测试的时候用的是不同的,训练的时候用的prototxt里面有test只是为了测试网络的训练程度,里面的测试集是验证集,并不是真正我们测试的时候用的网络定义 ...
caffe学习记录2——blobs
参考:caffe官网 2016-01-23 10:08:22 1 blobs,layers,nets是caffe模型的骨架 2 blobs是作者写好的数据存储的“容器”,可以有效实现CPU和GPU之 ...
Caffe学习笔记（一）：Caffe架构及其模型解析
Caffe学习笔记(一):Caffe架构及其模型解析写在前面:关于caffe平台如何快速搭建以及如何在caffe上进行训练与预测,请参见前面的文章<caffe平台快速搭建:caffe+wind ...
caffe学习三：使用Faster RCNN训练自己的数据
本文假设你已经完成了安装,并可以运行demo.py 不会安装且用PASCAL VOC数据集的请看另来两篇博客. caffe学习一:ubuntu16.04下跑Faster R-CNN demo (基于c ...
Matlab 进阶学习记录
最近在看 Faster RCNN的Matlab code,发现很多matlab技巧,在此记录: 1. conf_proposal = proposal_config('image_means', ...
Caffe学习系列(23)：如何将别人训练好的model用到自己的数据上
caffe团队用imagenet图片进行训练,迭代30多万次,训练出来一个model.这个model将图片分为1000类,应该是目前为止最好的图片分类model了. 假设我现在有一些自己的图片想进行分 ...
Caffe学习系列——工具篇：神经网络模型结构可视化
Caffe学习系列——工具篇:神经网络模型结构可视化在Caffe中,目前有两种可视化prototxt格式网络结构的方法: 使用Netscope在线可视化使用Caffe提供的draw_net.py ...
Caffe学习笔记2
Caffe学习笔记2-用一个预训练模型提取特征本文为原创作品,未经本人同意,禁止转载,禁止用于商业用途!本人对博客使用拥有最终解释权欢迎关注我的博客:http://blog.csdn.net/hi ...
CAFFE学习笔记（五）用caffe跑自己的jpg数据
1 收集自己的数据 1-1 我的训练集与测试集的来源:表情包由于网上一幅一幅图片下载非常麻烦,所以我干脆下载了两个eif表情包.同一个表情包里的图像都有很强的相似性,因此可以当成一类图像来使用.下载 ...

随机推荐

Pomelo热更新刷新handler和remote 以及 pomelo使用bearcat进行热更新
一. 开启原生 pomelo 的hotreload支持 pomelo版本: 2.2.5 , 编辑脚本 app.js 加入如下代码 //全局配置 app.configure('production|d ...
通过window(Navicat)访问linux中的mysql数据库
Centos安装Mysql数据库查看我们的操作系统上是否已经安装了mysql数据库 [root@centos~]# rpm -qa | grep mysql // 这个命令就会查看该操作系统上是否已 ...
Redis windows主从服务配置
一.下载redis解压如图: 二.复制redis.windows.conf 文件为 redis.windows_6380.conf 三.修改配置IP和端口四.配置从属于主服务的IP 和端口五. ...
Oracle18c创建不带C##的用户
18c数据库分两种数据库CDB(容器数据库).PDB(可插拔数据库) 数据库安装完成之后,默认是CDB 创建一个用户,必须要用C##开头,但使用PDB没有这个限制 1. 先查看PDB数据库servic ...
01_MapReduce流程总结
1. MapReduce整体流程 1. 每个map,reduce都作为1个独立进程process启动(多进程并发方式,spark是多线程并发) 2. 由于进程空间独享,因此方便控制每个map, red ...
select * from table_name where 1=1的
我们先来看看这个语句的结果:select * from table where 1=1,其中where 1=1,由于1=1永远是成立的,返回TRUE,条件为真:所以,这条语句,就相当于select * ...
JavaScript高级程序设计-读书笔记（4）
第11章 DOM扩展 1.选择符API Selector API Level 1 的核心是两个方法:querySelector()和querySelectorAll().在兼容的浏览器中,可以通过Do ...
HDU3864 D_num
本文版权归ljh2000和博客园共有,欢迎转载,但须保留此声明,并给出原文链接,谢谢合作. 本文作者:ljh2000 作者博客:http://www.cnblogs.com/ljh2000-jump/ ...
transform对定位元素的影响
1.温故知新 absolute:生成绝对定位的元素,相对于除position:static 定位以外的第一个有定位属性的父元素进行定位,若父元素没有定位属性则相对于浏览器窗口的左上角定位,定位的元素不 ...
dva-loading使用方法
1. 下载dva-loading npm install dva-loading --save 2. 导入并使用dva-loading import createLoading from 'dva-l ...

caffe 学习记录1及网络结构

caffe 学习记录1及网络结构的更多相关文章

随机推荐

热门专题