经典卷积神经网络—

一.网络结构

　　AlexNet由5层卷积层和3层全连接层组成。

　　论文中是把网络放在两个GPU上进行，为了方便我们仅考虑一个GPU的情况。

　　上图中的输入是224×224224×224，不过经过计算(224−11)/4=54.75(224−11)/4=54.75并不是论文中的55×5555×55，而使用227×227227×227作为输入，

　　卷积层C1：处理流程为：卷积、ReLU、LRN、池化、

　　　　卷积：输入为227x227x3，使用96个11x11x3的卷积核，步长为4x4，得到FeatureMap为55x55x96

　　　　池化：3x3最大池化，步长为2，得到27x27x96的FeatureMap

　　卷积层C2: 处理流程为：卷积、ReLU、LRN、池化

　　　　卷积：输入为27x27x96，使用256个5x5x96的卷积核(padding = 2)，步长为1x1，得到FeatureMap为27*27*256

　　　　池化：3x3最大池化，步长为2，得到13x13x26的FeatureMap

　　卷积层C3: 处理流程为：卷积、ReLU

　　　　卷积：输入为13x13x256，使用384个3x3x256的卷积核(padding = 1)，，步长为1x1，得到13x13x384的FeatureMap

　　卷积层C4: 处理流程为：卷积、ReLU

　　　　卷积：输入为13x13x384，使用256个3x3x384的卷积核(padding = 1)，，步长为1x1，得到13x13x256的FeatureMap

　　卷积层C5：处理流程为：卷积、ReLU、池化

　　　　卷积：输入为13x13x256，使用256个3x3x256的卷积核，步长为1x1(padding = 1)，，得到13x13x256的FeatureMap

　　　　池化：3x3的最大池化，步长为2，得到6x6x256的FeatureMap

　　全连接层FC6: 处理流程为：全连接、ReLU、Dropout

　　　　全连接；输入为6x6x256，使用4096个6x6x256的卷积核，得到1x1x4096

　　全连接层FC7: 处理流程为：全连接、ReLU、Dropout

　　　　全连接：输入1x1x4096，使用4096个1x1x4096的卷积核，得到1x1x4096

　　输出层：第七层4096个数据与第八层1000个神经元进行全连接，输出1000个float值

二.,模型特点

　　1.ReLU Nonlinearity

　　标准L-P神经元的输出一般使用tanh或者sigmoid函数作为激活函数，这些饱和的非线性函数计算机梯度的时候要比非饱和函数max(0,x)慢得多，把非饱和线性函数成为Rectified Linear Units（ReLUs)

　　2.在两个GPU上训练

　　使用的GPU为GTX 580，内存只有3GB，使用一个GPU可能会限制训练网络的大小规模，因此使用两个GPU。　　

　　并行方案为把一半的神经元放在一个GPU上，GPU的交流仅在一些层上。比如第三层的将第二层的所有输出作为输入，但是第四层将第三层只属于同个GPU的输出作为输入。

　　3.Local Response Normalization

　　引入LRN，是为了模仿生物上，被激活的神经元抑制相邻神经元，即侧抑制，归一化的目的就是抑制，LRN借鉴侧抑制实现局部抑制。

　　其中bⁱ_x,y为归一化后的值，i表示通道的位置，x，y代表像素更新的位置

　　aⁱ_{x,y为输入值，是激活函数ReLU的输入值}

　　k，alpja，beta，n/2为自定义系数，一般设置k=2,n=5,alpha=1Xe-4,beta=0.75。

　　∑叠加方向是沿着通道方向，也就是一个点同方向的前面n/2个通道和后n/2个通道的点的平方和(n+1个点）

　　但是其他较晚产生的卷积神经网络模型基本不含LRN层，因为LRN的效果不明显，但是会增加2倍的前馈、反馈时间。

　　同时，LRN对激活函数的选择也有些要求，LRN对于ReLU这种不存在上限边界的激活函数比较有用，因为LRN层的原理就是从多个卷积核响应中选择值比较大的那一个，但是不适合sigmod或tanh这种由上下固定边界的的激活函数，因为这种边界本身就抑制了较大的输入值。

　　3.4Overlapping pooling

　　重叠池化有助于减少过拟合。

　　设池化的大小为zxz，步长为s，如果s<z,即每次池化都会和相邻池化有一部分重叠，称为重叠池化

三.减少过拟合操作

　　1数据增强

　　模型随机从256x256大小的原始图像中截取224x224大小的区域，同时还得到图片进行水平翻转后的镜像，相当于数据扩充了2048倍(2^(5+5+2))

　　测试时，模型会先截取一张图片的四个角加中间位置，并进行左右翻转，这样会获得10张图片，将10张图片作为预测的输入并对得到的10个预测结果求平均值，就是这样图片的预测结果。

　　2.dropout

　　在训练过程中，对全连接的神经元按照一定的概率将其暂时从网络中丢弃，暂时是指在此次训练中，被丢弃的神经元不进行前馈和BP了。

　　对于随机梯度下降来说，由于是随机丢弃，故每一个batch都是在训练一个不同的网络，这样就可以综合多个网络的训练结果。

经典卷积神经网络——AlexNet的更多相关文章

TensorFlow实战之实现AlexNet经典卷积神经网络
本文根据最近学习TensorFlow书籍网络文章的情况,特将一些学习心得做了总结,详情如下.如有不当之处,请各位大拿多多指点,在此谢过. 一.AlexNet模型及其基本原理阐述 1.关于AlexNet ...
经典卷积神经网络（LeNet、AlexNet、VGG、GoogleNet、ResNet）的实现（MXNet版本）
卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现. 其中文章详解卷 ...
五大经典卷积神经网络介绍：LeNet / AlexNet / GoogLeNet / VGGNet/ ResNet
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! LeNet / AlexNet / GoogLeNet / VGG ...
经典卷积神经网络算法(2)：AlexNet
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
经典卷积神经网络的学习（一）—— AlexNet
AlexNet 为卷积神经网络和深度学习正名,以绝对优势拿下 ILSVRC 2012 年冠军,引起了学术界的极大关注,掀起了深度学习研究的热潮. AlexNet 在 ILSVRC 数据集上达到 16. ...
经典卷积神经网络算法(5)：ResNet
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
经典卷积神经网络的学习（二）—— VGGNet
1. 简介 VGGNet 是牛津大学计算机视觉组(Visual Geometry Group)和 Google DeepMind 公司的研究员一起研发的深度卷积神经网络,其主要探索了卷积神经网络的深度 ...
经典卷积神经网络算法(1)：LeNet-5
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
经典卷积神经网络算法(3)：VGG
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...

随机推荐

easyui-dialog打开之后append("标签")标签存在但是显示不出来
初始化dialog $("#upDiv").dialog("open");//初始化dialog弹出窗口注意: 1: append("标签&quo ...
groovy http
import groovy.json.JsonOutput void api(){ def data = [jobId : "11111111111111", data : 5,s ...
[一道区间dp][String painter]
http://acm.hdu.edu.cn/showproblem.php?pid=2476 String painter Time Limit: 5000/2000 MS (Java/Others) ...
springAop Schedule，注解annotation 实现任务监控
我们有很多定时任务在任务工程中执行,但是如果我们不加以监控,很有可能定时任务死掉或者卡住我们都不知道. 所以需要做一个任务监控.监控任务当前执行的状态. 还是那样,先让定时任务启动起来,当前我们使用的 ...
python 实践--新闻聚合
采集新闻,体会到面向问题和面向对象的区别. 如果希望新闻来源多出,比如NNTP,Web.可以实现:Source,Destination,NewItem,NewAgent. Scoure处理来源, De ...
SIGAI深度学习第八集卷积神经网络2
讲授Lenet.Alexnet.VGGNet.GoogLeNet等经典的卷积神经网络.Inception模块.小尺度卷积核.1x1卷积核.使用反卷积实现卷积层可视化等. 大纲: LeNet网络 Ale ...
P4053 [JSOI2007]建筑抢修堆贪心
思路:堆贪心提交:1次题解: 先按时间$sort$,然后如果能修就直接扔堆里,不能修取堆顶比一下时间长短,把时间短的扔进堆: #include<cstdio> #include&l ...
PHP mysqli_character_set_name() 函数
返回数据库连接的默认字符集: <?php $con=mysqli_connect("localhost","my_user","my_passw ...
mkfs/mk2fs/fsck/e2fsck/tune2fs/blkid
mkfs 格式化创建Linux文件系统的工具 centos 6 使用xfs文件系统 fsck 检测及修复文件系统的工具当磁盘出现逻辑错误的时候,可以尝试修复. fsck -t ext2|ext3 / ...
stark项目流程
1 创建Django项目 2 创建app python manage.py startapp app名 3 文件配置 app配置静态文件配置创建文件夹,下载bootstrap,jquery 归档文 ...

经典卷积神经网络——AlexNet

经典卷积神经网络——AlexNet的更多相关文章

随机推荐

热门专题