Very Deep Convolutional Networks for Large-scale Image Recognition(vggnet)

有梦就要去实现他 2024-09-05 15:44:23 原文

vggNet是从AlexNet而来，主要探索卷积神经网络的深度与性能之间的关系，通过反复堆叠3x3的卷积核（c中有1x1的卷积核,也只有c中有，c是16层）和2x2的最大池化层，vggNet构筑了16-19层深的卷积神经网络。

3x3卷积核：the smallest size to capture the notion of left/right,up/down,center

1x1卷积核：can be seen as a linear transformation of th input channels(followed by non-linearity)

整个网络的convolution stride固定为1，所有隐藏层的激活函数都用relu。

vggNet网络堆叠stride为1的3x3卷积核。两个3x3的卷积核堆叠的局部感受野相当于一个5x5的局部感受野，3个3x3的卷积核堆叠的局部感受野相当于7x7的局部感受野。堆叠的3x3卷积核比直接使用大的卷积核有两个好处：

1.增加非线性，因为每一层卷积核都有非线性激活函数relu，3层的3x3卷积核比7x7卷积核多进行了两次非线性变换，这样使得decision function more discriminative

2.减少了参数。假设通道数为c，3层3x3卷积核的参数量是3*（3*3*C*C），1层7x7卷积核的参数量是7*7*C*C。

vggNet中的1x1卷积核：GoogLeNet也采用了1x1卷积核，但不同的是，vggNet目的是增加非线性，而没有降维的目的。vggNet中要求1x1卷积核的输入输出维度应相等。

http://blog.csdn.net/wcy12341189/article/details/56281618 讲解vgg

http://blog.csdn.net/u014114990/article/details/51125776 多通道参数量的计算

Very Deep Convolutional Networks for Large-scale Image Recognition(vggnet)的更多相关文章

VGGNet论文翻译-Very Deep Convolutional Networks for Large-Scale Image Recognition
Very Deep Convolutional Networks for Large-Scale Image Recognition Karen Simonyan[‡] & Andrew Zi ...
Very Deep Convolutional Networks for Large-Scale Image Recognition
Very Deep Convolutional Networks for Large-Scale Image Recognition 转载请注明:http://blog.csdn.net/stdcou ...
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition Kaiming He, Xiangyu Zh ...
目标检测--Spatial pyramid pooling in deep convolutional networks for visual recognition(PAMI, 2015)
Spatial pyramid pooling in deep convolutional networks for visual recognition 作者: Kaiming He, Xiangy ...
SPPNet论文翻译-空间金字塔池化Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
http://www.dengfanxin.cn/?p=403 原文地址我对物体检测的一篇重要著作SPPNet的论文的主要部分进行了翻译工作.SPPNet的初衷非常明晰,就是希望网络对输入的尺寸更加 ...
《DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks》研读笔记
<DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks>研读笔记论文标题:DSLR-Quality ...
2014-VGG-《Very deep convolutional networks for large-scale image recognition》翻译
2014-VGG-<Very deep convolutional networks for large-scale image recognition>翻译原文:http://xues ...
深度学习论文翻译解析（九）：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
论文标题:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 标题翻译:用于视觉识别的深度卷积神 ...
论文笔记：（2019CVPR）PointConv: Deep Convolutional Networks on 3D Point Clouds
目录摘要一.前言 1.1直接获取3D数据的传感器 1.2为什么用3D数据 1.3目前遇到的困难 1.4现有的解决方法及存在的问题二.本文idea 2.1 idea来源 2.2 初始思路 2.3 ...
大规模视觉识别挑战赛ILSVRC2015各团队结果和方法 Large Scale Visual Recognition Challenge 2015
Large Scale Visual Recognition Challenge 2015 (ILSVRC2015) Legend: Yellow background = winner in thi ...

随机推荐

zabbix_agent 主动模式配置
一,主动与被动模式默认的模式就是被动模式由服务端发送执行指令,客户端再执行主动模式则为客户机自己找服务器拿任务执行二,主动模式配置查看客户端配置文件 grep '^[a-Z]' /etc/za ...
ffmpeg+cuda+opencv
为了让ffmpeg使用gpu进行解码,可以按以下步骤: 1 下载nvidia官网提供的ffmpeg,编译安装 https://developer.nvidia.com/ffmpeg 注意原来的选项上还 ...
java的访问修饰符
Java中通过访问控制符(default,private,public,protected)来控制对类.变量.方法.构造方法的访问. 下表说明了4中修饰符的访问权限: 修饰符当前类同一包内子孙类 ...
ArrayList，LinkList，HashMap
ArrayList底层实现数组,这是ArrayList get()方法的源码,底层是数组根据下标返回在数组中对应的位置 ,查询快,插入慢 // Positional Access Operation ...
吴恩达《Machine Learning Yearning》总结（1-10章）
1.为什么选择机器学习策略案例:建立猫咪图像识别app 系统的优化可以有很多的方向: (1)获取更多的数据集,即更多的图片: (2)收集更多多样数据,如处于不常见的位置的猫的图,颜色奇异的猫的照片等 ...
深入理解JavaScript系列（29）：设计模式之装饰者模式
介绍装饰者提供比继承更有弹性的替代方案. 装饰者用用于包装同接口的对象,不仅允许你向方法添加行为,而且还可以将方法设置成原始对象调用(例如装饰者的构造函数). 装饰者用于通过重载方法的形式添加新功能 ...
linux shell内置判断
内置判断,成功的时候返回0,不成功返回非零 test 判断表达式 [ 判断表达式 ] 注意前后必须留空格哦数值运算 -eq 等于 -ne 不等于 -gt 大于 -ge ...
同源策略和Jsonp、CORS
一.同源策略同源策略(Same origin policy)是一种约定,它是浏览器最核心也最基本的安全功能,如果缺少了同源策略,则浏览器的正常功能可能都会受到影响.可以说Web是构建在同源策略基础之 ...
20_AOP_Advice增强1（前置、后置、环绕）
[增强的类型] 1.前置增强:org.springframework.aop.BeforeAdvice. 由于Spring只支持方法级别的增强,所以MethodBeforeAdvice是目前可用的前置 ...
机器学习（一）——K-近邻（KNN）算法
最近在看<机器学习实战>这本书,因为自己本身很想深入的了解机器学习算法,加之想学python,就在朋友的推荐之下选择了这本书进行学习. 一 . K-近邻算法(KNN)概述最简单最初级的 ...