AlexNet模型

《ImageNet Classification with Deep Convolutional Neural Networks》阅读笔记
一直在使用AlexNet，本来早应该读这篇经典论文了。可能是这篇论文涉及到的理论有点多，解释不是很通俗，有了一段时间的实际经验后读完这篇论文深有感悟。
下面按论文的标题分别记录：

The Dataset

ILSVRC：1000类，每类约1000张图片，大约有120w训练图片，5w张验证图片，15w张测试图片。

AlexNet输入为固定尺寸：256*256，从原始图片进行resize and crop得到。唯一一个预处理是所有图像在进入网络时减去整体均值。

ReLU Nonlinearity

ReLU是一种不饱和非线性函数，相对传统的饱和非线性函数具有更快的收敛速度，可以加速拟合训练集。Jarrettet用ReLU来阻止过拟合。

Training on Multiple GPUs

使用多个两个GPU是为了解决单个GPU内存限制了网络大小，将原网络拆成两半，比如说第一层卷积应该输出55×55×96，现拆成两个55×55×48。这里GPU只在某些层进行互相通信。

Local Response Normalization

论文中提出的LRN属于CROSS_CHANNEL的，作用是模拟生物神经上的侧抑制（ lateral inhibition，或者叫邻近抑制），使相邻神经元的激活值之间产生竞争。因为每个神经元的激活值需要除以相邻神经元的激活值的平方和，因此如果相邻神经元含有较大激活值的话，本身LRN后的激活值就变小了。

Reducing Overfitting

论文介绍了两种防止过拟合的方法：
1.Data Augmentation
Data Augmentation是通过少量的计算从原始图片变换得到新的训练数据。第一种是随机裁剪，原图256×256，裁剪大小为224×224，由于随机，所以每个epoch中对同一张图片进行了不同的裁剪，理论上相当于扩大数据集32×32×2=2048倍！32是256-224；2是由于水平翻转。
在预测（deploy）阶段,不是随机裁剪，而是固定为图片四个边角，外加中心位置。翻转后进行同样操作，共产生10个patch。
2.Dropout
Dropout是借鉴了多个模型结合的想法，对于一个分类问题，如果有多个训练完备的不同的模型，同时对一个输入做出预测，然后少数服从多数，显然会减小错误率。实际的做法是：每个隐层神经元的输出有0.5的概率置为0，置为0的神经元就不会参加前向传播和反向更新。这样做的好处是有效防止过拟合，但是缺点是网络收敛需要的迭代次数增加一倍。

Details of learning

batch size=128

momentum=0.9

weight decay=0.0005

initial learining rate=0.01 reduce three times(factor :10)

iter epoch=90

The update rule for weight w was

vi+1:=0.9⋅vi−0.0005⋅ϵ⋅wi−ϵ⋅<∂L∂W|wi>Divi+1:=0.9·vi−0.0005·ϵ·wi−ϵ·<∂L∂W|wi>Di

wi+1:=wi+vi+1wi+1:=wi+vi+1

<∂L∂W|wi>Di<∂L∂W|wi>Di为参数对应的梯度，ϵϵ为学习速率。

AlexNet模型的更多相关文章

AlexNet模型的解析及tensorflow实现
AlexNet是ImageNet LSVRC 2012比赛中分类效果第一的深度神经网络模型,点击链接下载论文http://papers.nips.cc/paper/4824-imagenet-clas ...
基于Caffe训练AlexNet模型
数据集 1.准备数据集 1)下载训练和验证图片 ImageNet官网地址:http://www.image-net.org/signup.php?next=download-images (需用邮箱注 ...
吴裕雄 python 神经网络——TensorFlow实现AlexNet模型处理手写数字识别MNIST数据集
import tensorflow as tf # 输入数据 from tensorflow.examples.tutorials.mnist import input_data mnist = in ...
Ubuntu下caffe：用自己的图片训练并测试AlexNet模型
参考博客:https://blog.csdn.net/eereere/article/details/79118645#commentBox 目录 1.准备图片 2. 将图片路径写入txt 参考这 ...
大话CNN经典模型：AlexNet
2012年,Alex Krizhevsky.Ilya Sutskever在多伦多大学Geoff Hinton的实验室设计出了一个深层的卷积神经网络AlexNet,夺得了2012年ImageNet LS ...
#Deep Learning回顾#之LeNet、AlexNet、GoogLeNet、VGG、ResNet
CNN的发展史上一篇回顾讲的是2006年Hinton他们的Science Paper,当时提到,2006年虽然Deep Learning的概念被提出来了,但是学术界的大家还是表示不服.当时有流传的段 ...
【深度学习系列】用PaddlePaddle和Tensorflow实现AlexNet
上周我们用PaddlePaddle和Tensorflow实现了图像分类,分别用自己手写的一个简单的CNN网络simple_cnn和LeNet-5的CNN网络识别cifar-10数据集.在上周的实验表现 ...
TensorFlow实战之实现AlexNet经典卷积神经网络
本文根据最近学习TensorFlow书籍网络文章的情况,特将一些学习心得做了总结,详情如下.如有不当之处,请各位大拿多多指点,在此谢过. 一.AlexNet模型及其基本原理阐述 1.关于AlexNet ...
【深度学习系列】用PaddlePaddle和Tensorflow实现经典CNN网络AlexNet
上周我们用PaddlePaddle和Tensorflow实现了图像分类,分别用自己手写的一个简单的CNN网络simple_cnn和LeNet-5的CNN网络识别cifar-10数据集.在上周的实验表现 ...

随机推荐

flex：1将页面铺满
代码示范: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF ...
JAVA算法之递归
Ⅰ.三角数字首先我们来看一组数字:1,3,6,10,15,21.....,在这个数列中第n项是由n-1项加n得到的,这个序列中的数字称为三角数字因为他们可以形象化地表示成一个三角形排列.如下图通过 ...
jvm虚拟内存分布与 GC算法
jvm虚拟内存分布程序计数器(PC寄存器)(线程私有): 每个线程启动的时候,都会创建一个PC(Program Counter,程序计数器)寄存器. PC寄存器的内容总是指向下一条将被执行指令的地址 ...
页面JS缓存问题解决方案
.在jsp中加入头 <META HTTP-EQUIV="Pragma" CONTENT="no-cache"> <META HTTP-EQUI ...
Java 基础数据类型
Java 提供的基础数据类型(也称内置数据类型)包含:整数类型.浮点类型.字符类型.布尔类型. 整数类型整数类型变量用来表示整数的数据类型.整数类型又分为字节型(byte).短整型(short).整 ...
使用gulp搭建less编译环境
什么是less? 一种动态样式语言. LESS 将 CSS 赋予了动态语言的特性,如变量, 继承, 运算, 函数. LESS 既可以在客户端上运行 (支持IE 6+, Webkit, Fi ...
USACO 2006 November Gold Fence Repair /// 贪心(有意思)(优先队列) oj23940
题目大意: 输入N ( 1 ≤ N ≤ 20,000 ) :将一块木板分为n块每次切割木板的开销为这块木板的长度,即将长度为21的木板分为13和8,则开销为21 接下来n行描述每块木板要求的长度Li ...
jQuery鼠标拖曳改变div大小（模拟textarea右下角拖曳）
jQuery.fn.extend({ drag: function() { $(document).off("mouseup.drag").on("mouseup.dra ...
WebException: The underlying connection was closed: Could not establish trust relationship for the SSL/TLS secure channel
关于这个异常的问题网上有很多的解决方案. 最为靠谱的有: http://www.cnblogs.com/hjf1223/archive/2007/03/14/674502.html(若因为链接而导致不 ...
Python全栈开发：json与pickle
#!/usr/bin/env python # -*- coding;utf-8 -*- """ 正解(序列化):将Python数据类型转换成json或者pickle格式 ...

AlexNet模型

AlexNet模型

The Dataset

ReLU Nonlinearity

Training on Multiple GPUs

Local Response Normalization

Reducing Overfitting

Details of learning

AlexNet模型的更多相关文章

随机推荐

热门专题