caffe 学习记录1及网络结构

ubuntu git clone 默认在当前文件夹

caffe 基础了解：https://www.zhihu.com/question/27982282/answer/39350629

当然，官网才是大牛：http://caffe.berkeleyvision.org/

Caffe支持三种数据格式输入网络，包括Image(.jpg, .png等)，leveldb，lmdb，根据自己需要选择不同输入吧。

深度学习结构剖析（错误纠正，（2）代表一个滤波器多个参数<->一个滤波器一个参数）

http://blog.csdn.net/zouxy09/article/details/8781543（原文）（实际上caffe并不这么做）这是我一直困惑的，被这个教程搞得一个星期头晕。caffe中所有输入特征子图和所有输出特征子图都相连。或许，以后直接从直观上思考这个问题，什么破连接，什么节点图，晕死！

http://www.cnblogs.com/tornadomeet/archive/2013/05/05/3061457.html（计算详细一文）

链接1的一个评论：再解释下C3的1516个权值是怎么来的。可以看这个博客http://www.cnblogs.com/tornadomeet/archive/2013/05/05/3061457.html
S2层有6个特征图，尺寸14*14。可以认为S2每个特征图是由14*14个共享权值的神经元输出的（等效为一个神经元卷积）。注意S2与C3不完全连接，C3的第一个特征图只与S2前三个特征图相连。具体看：C3里第一个特征图的一个神经元，与S2里第一个特征图的5*5神经元相连，同时也与第二个特征图的5*5相连，也与第三个特征图的5*5相连。因此C3第一个特征图的权值数为(5*5*3+1).
其实应该有个非常形象化的过程，就是三维卷积，你把S2层想成一个立方体，厚度为6，横截尺寸14*14, C3第一个特征图实际上是对这个立方体前三层的三维卷积。
再说连接数，C3第一个特征图里共享权值的神经元是10*10个，因此连接数是（5*5*3+1）*100

1516怎么来的？
（5*5*3+1）*6+（5*5*4+1）*9+（5*5*6+1）=1516
连接数，其实就是神经元复制了100次：
1516*100

看到下面有人说卷积核是60个，这个理解应该是把卷积只限制在S2的一个特征图上了，用三维卷积的角度考虑，卷积核实际上实在多特征图上进行，所以卷积核应该是16个
（用60个卷积核推导出的权值数和连接数还是1516和151600吗？？）

个人理解，如果错了恳求大家指出，我也好改正

按照链接2（good）：计算C5，由于全连接，故有，C5和S4中所有的挨个连，然后共加起来，再添加一个偏置，共（5*5*16+1）=401个参数，则120个共有120*401=48120个参数。当然，由于滤波器扫描移动是“1*1”，故连接数也是48120个。

按照链接2：F6的连接84（设计的），每个都全连接C5中120个特征子图（1*1），然后加起来，再添加一个偏置，共（1*1*120+1）=121个参数，则84个共有

84*121=10164个

注1：如此，输入相当于只有一个特征子图。

注2：最终经过一个sigmoid函数输出。还有什么径向基函数

总结思路：

参数计算：我的判别式如下表达式，其中L是上层C_k-1层的特征子图个数，F是滤波器参数个数，通常等于*×*，1是偏置，i代表本层C_k标号，共C个特征子图。L_ik指C_k层的第i个连接C_k-1层的特征子图个数。的求和指对所有标号求和，因为，不是全连接时，各个标号是不对称的，对应的参数也不一样。

（1）特殊地，对于pooling，通常F=1，L_ik=1，代表滤波器只有一个参数，F=1感受野的像素之后乘上一个权重，L=1代表pooling只可能与C_i-1有关。

（2）特殊地，对于第一数据输入层，L_ik=1

连接数的计算：我的判别式如下表达式，说明类似上面，多加一个M，代表C_k层每个滤波器在C_k-1层滑动的总步数，通常等于*×*。考虑可能滑动之后与滑动之前有部分重叠，也有可能不重叠。特殊地，M不使前后层重叠。对于pooling，通常F=1，L_ik=1，代表滤波器只有一个参数，F=1感受野的像素之后乘上一个权重，L_ik=1代表pooling只可能与C_k-1有关。

注意：

最后给出caffe作者的图文解释：http://www.zhihu.com/question/28385679

按照caffe中的结论，对比总结中的参数计算，Lik=上层特征子图数（通道数/输入个数）

caffe 学习记录1及网络结构的更多相关文章

caffe学习记录
结论: caffe网络的prototxt训练与测试的时候用的是不同的,训练的时候用的prototxt里面有test只是为了测试网络的训练程度,里面的测试集是验证集,并不是真正我们测试的时候用的网络定义 ...
caffe学习记录2——blobs
参考:caffe官网 2016-01-23 10:08:22 1 blobs,layers,nets是caffe模型的骨架 2 blobs是作者写好的数据存储的“容器”,可以有效实现CPU和GPU之 ...
Caffe学习笔记（一）：Caffe架构及其模型解析
Caffe学习笔记(一):Caffe架构及其模型解析写在前面:关于caffe平台如何快速搭建以及如何在caffe上进行训练与预测,请参见前面的文章<caffe平台快速搭建:caffe+wind ...
caffe学习三：使用Faster RCNN训练自己的数据
本文假设你已经完成了安装,并可以运行demo.py 不会安装且用PASCAL VOC数据集的请看另来两篇博客. caffe学习一:ubuntu16.04下跑Faster R-CNN demo (基于c ...
Matlab 进阶学习记录
最近在看 Faster RCNN的Matlab code,发现很多matlab技巧,在此记录: 1. conf_proposal = proposal_config('image_means', ...
Caffe学习系列(23)：如何将别人训练好的model用到自己的数据上
caffe团队用imagenet图片进行训练,迭代30多万次,训练出来一个model.这个model将图片分为1000类,应该是目前为止最好的图片分类model了. 假设我现在有一些自己的图片想进行分 ...
Caffe学习系列——工具篇：神经网络模型结构可视化
Caffe学习系列——工具篇:神经网络模型结构可视化在Caffe中,目前有两种可视化prototxt格式网络结构的方法: 使用Netscope在线可视化使用Caffe提供的draw_net.py ...
Caffe学习笔记2
Caffe学习笔记2-用一个预训练模型提取特征本文为原创作品,未经本人同意,禁止转载,禁止用于商业用途!本人对博客使用拥有最终解释权欢迎关注我的博客:http://blog.csdn.net/hi ...
CAFFE学习笔记（五）用caffe跑自己的jpg数据
1 收集自己的数据 1-1 我的训练集与测试集的来源:表情包由于网上一幅一幅图片下载非常麻烦,所以我干脆下载了两个eif表情包.同一个表情包里的图像都有很强的相似性,因此可以当成一类图像来使用.下载 ...

随机推荐

推荐一个快速了解移植uboot以及linux到新板子上的ppt教程
链接地址在此: https://elinux.org/images/2/2a/Schulz-how-to-support-new-board-u-boot-linux.pdf
linux中__weak关键字的作用
答:1.可以重新定义同名函数或变量而编译时不报错
关于vuex与v-route的结合使用
把vue实际用于项目的过程中遇到过一些问题 1.如何将vuex和vue-route结合使用(接口调用成功回调页面这类等等) 1.初始考虑的方法是在vuex引入vue-router,vuex写一些业务逻 ...
从0开始 Java实习黑白棋
黑白棋的设计代码如下: import java.util.*; public class Chess{ char[][] chess = new char[16][16]; public stati ...
ThinkPHP的URL重写时遇到No input file specified的解决方法
因为在Fastcgi模式下,php不支持rewrite的目标网址的PATH_INFO的解析 ThinkPHP运行在URL_MODEL=2时,会出现 No input file specified.的情 ...
java的时间获取
System类代表系统,系统级的很多属性和控制方法都放置在该类的内部.该类位于java.lang包. currentTimeMillis方法 public static long currentTim ...
java高级特性（1）--理解面向对象思想
前言: 优秀的代码具备:高性能.可重用.可扩展.易维护.易理解具体实现: 高性能:合理使用算法,数据结构等等可重用:封装.继承可扩展:多态易维护.易理解:命名规范 + 注解面向对象是一种思想 ...
django 使用form组件提交数据之form表单提交
django的form组件可以减少后台在进行一些重复性的验证工作,极大降低开发效率. 最近遇到一个问题: 当使用form表单提交数据后,如果数据格式不符合后台定义的规则,需要重新在前端页面填写数据. ...
em和px的区别一次彻底搞清楚！
在国内网站中,包括三大门户,以及“引领”中国网站设计潮流的蓝色理想,ChinaUI等都是使用了px作为字体单位.只有百度好歹做了个可调的表率.而在大洋彼岸,几乎所有的主流站点都使用em作为字体单位, ...
作业列表 of《软件测试技术》
作业1(截止时间3月22日) 请使用excel模板或word模板,完成对126邮箱登录功能的测试用例编写,界面如下图.提交到ftp. --------------------------------- ...

caffe 学习记录1及网络结构

caffe 学习记录1及网络结构的更多相关文章

随机推荐

热门专题