AleNet模型笔记

谁创造了AlexNet?

　　AlexNet是有Hinton大神的弟子Alex Krizhevsky提出的深度卷积神经网络。它可视为LeNet的更深更宽的版本。

AlexNet主要用到的技术

成功使用ReLU作为CNN的激活函数，并验证了其效果在较深的神经网络超过了sigmiod,成功解决了sigmoid在网络较深时的梯度弥散问题。
训练时候使用Dropout以一定概率随机失活了一部分神经元，一面模型过拟合。
使用重叠最大池化方法：池化核尺寸大于步长，是的卷积层的输出之间有重叠部分，提升了特征的丰富性。
提出了LRN（局部相应归一化），对局部神经元创建竞争机制，使得响应大的神经元输出变得更大，抑制了反馈较小的神经元。一定程度提升了泛化能力。
使用CUDA加速，两块GTX 580 3GB 显卡加速。这导致论文中的网络结构图分为两路训练。
采用数据增强：随机地从226*226的原图中截取224*224大小的区域（水平翻转以及镜像），数据增强有效抑制过拟合，提高泛化能力。

网络结构

　　整个AlexNet有8个需要训练的层（不包含LRN和池化层），前5层是卷积层，后三层是全连接层，其中最后的全连接层输出是一个1000通道softmax映射归一化结果，表示输入在1000类别的响应情况，或者说在归属类上的概率分布，再细致的说就是每个通道的softmax输出表示输入属于该类的可能性。由于当时显存容量的限制，作者使用了2块GTX580 3GB RAM 的GPU并行训练，所以网络分成两路。

如今我们显卡已经足够，可以并成一路。

以上的网络中:

5个卷积层的卷积核依次为：11*11*3@96，5*5*96@256，3*3*256@384，3*3*384@384，3*3*384@265，步长依次为4,1,1,1,1，模式为VALID,SAME,SAME,SAME,SAME
池化层在第①第②和第⑤个卷积层之后，每一次池化，尺寸减半。
LRN在第①和第②的池化层和ReLU后的后的卷积层之间
随后就是三个全连接层，最后一个全连接层是softmax输出的结果。

AlexNet的实现

（待续）

参考

https://blog.csdn.net/sun_28/article/details/52134584

《tensorflow实战》

AleNet模型笔记的更多相关文章

《C#并行编程高级教程》第9章异步编程模型笔记
这个章节我个人感觉意义不大,使用现有的APM(异步编程模型)和EAP(基于时间的异步模型)就很够用了,针对WPF和WinForm其实还有一些专门用于UI更新的类. 但是出于完整性,还是将一下怎么使用. ...
关于thinkphp框架中模型笔记
模型这一块,感觉学习的不是很清楚,单独水一贴thinkphp中模型的学习笔记. 0x01 模型类简介数据库中每一张表对应一个模型,类名就是表名,类里面的成员变量就是列名, 把一张表对应为一个类,其中 ...
Netty Reactor 线程模型笔记
引用: https://www.cnblogs.com/TomSnail/p/6158249.html https://www.cnblogs.com/heavenhome/articles/6554 ...
tp5模型笔记---多对多
关联模型一对一:HAS_ONE 以及对应的BELONEGS_TO 一对多:HAS_MANY 以及相对的BELONGS_TO 多对多:BELONGS_TO_MANY 步骤: 第一:创建Users模型 ...
经典卷积网络模型 — VGGNet模型笔记
一.简介 VGGNet是计算机视觉组(Visual Geometry Group)和Google DeepMind公司的研究员一起研究的深度卷积神经网络.VGGNet探索了卷积神经网络深度与性能之间的 ...
经典卷积网络模型 — LeNet模型笔记
LeNet-5包含于输入层在内的8层深度卷积神经网络.其中卷积层可以使得原信号特征增强,并且降低噪音.而池化层利用图像相关性原理,对图像进行子采样,可以减少参数个数,减少模型的过拟合程度,同时也可以保 ...
机器学习-HMM隐马尔可夫模型-笔记
HMM定义 1)隐马尔科夫模型 (HMM, Hidden Markov Model) 可用标注问题,在语音识别. NLP .生物信息.模式识别等领域被实践证明是有效的算法. 2)HMM 是关于时序的概 ...
机器学习-LDA主题模型笔记
LDA常见的应用方向: 信息提取和搜索(语义分析):文档分类/聚类.文章摘要.社区挖掘:基于内容的图像聚类.目标识别(以及其他计算机视觉应用):生物信息数据的应用; 对于朴素贝叶斯模型来说,可以胜任许 ...
机器学习-EM算法-pLSA模型笔记
pLSA模型--基于概率统计的pLSA模型(probabilistic Latent Semantic Analysis,概率隐语义分析),增加了主题模型,形成简单的贝叶斯网络,可以使用EM算法学习模 ...

随机推荐

SpringCloud的服务注册中心（四）- 高可用服务注册中心的搭建
一.双服务注册注册中心 1.服务注册中心的服务端 - EurekaServer 1.1.EurekaServer1 String.application.name=eureka-server ser ...
Spring Security入门（3-1）Spring Security的登录页面定制
Spring 4.2.5 + Quartz 2.2.0整合
jar包使用的Maven库管理的,在这就不罗列了,注意下只有spring3.x以上的版本才支持quartz2.x的版本. 配置文件: <?xml version="1.0" ...
H5 input输入限制最大位数，和调用小键盘需求发生冲突的解决办法
首先,限制输入最大位数时,input有自带的属性maxlength. <input type="text" name="email" maxlength= ...
Hive函数：CUME_DIST,PERCENT_RANK
参考自:大数据田地http://lxw1234.com/archives/2015/04/185.htm 数据准备: d1,user1, d1,user2, d1,user3, d2,user4, d ...
基于angularJS搭建的管理系统
前言 angularJS搭建的系统,是一年前用的技术栈,有些地方比较过时,这里只是介绍实现思路前端架构工程目录项目浅析项目依赖包配置package.json { "name" ...
YARN中FIFO、Capacity以及Fari调度器的详细介绍
(1)FIFO Scheduler 将所有的Applications放到队列中,先按照作业的优先级高低.再按照到达时间的先后,为每个app分配资源.如果第一个app需要的资源被满足了,如果还剩下了资源 ...
SSO-单点统一登录系统的设计与实现
本文主要基于web类应用展开讨论,提供的是一种通用机制和方法,所以不论何种技术栈都可进行相应的具体实现. 实现目标可以在相同或跨域环境下完成各应用的统一登录/注销方案原理本质上是采用了web应用 ...
[LeetCode] Lonely Pixel II 孤独的像素之二
Given a picture consisting of black and white pixels, and a positive integer N, find the number of b ...
ognl版本错误
错误信息: 2014-2-6 21:20:10 org.apache.catalina.core.StandardWrapperValve invoke严重: Servlet.service() fo ...