课时14 卷积神经网络详解（上）

CNN处理的是一些数据块，在这之间有很多层，一系列的层将输入数据变换为输出数据，所以完成操作的中间量不仅是NN时候讲的那些向量，而是立体结构，有宽，高和深度，在整个计算过程中要保持这些三维特征。这里的深度指的是一个数据体的第三个维度。

工作流程

我们得到一些数据，作为网络的输入，在CNN中我们有这样的滤波器，假设现在我们只有一个滤波器，这些滤波器空间维度很小，我们用这个滤波器来和输入图像做卷积运算。这里的卷积运算，意思是说滤波器要在这个图像的空域范围内全部位置滑动，而且，在每一个位置滤波器和图像做点乘。滤波器表示为w，把这些滤波器当做你的一堆w，然后你在图像范围内滑动这个滤波器，随着我们滑动滤波器，还要计算w的转置和x的乘积加上b。这里的x是输入数据的一小块区域，大小为滤波器的大小。当滤波器在滑动的时候，最后得到的整个结果，我们叫做激活图。激活图给出了在每个空间位置处滤波器的反应。

课时15 卷积神经网络详解（下）

我们每次做池化层时都扔掉了一小部分信息

在全连接层之前会有深度减少的地方

输入的数据中，边缘的数据可能和中心不太一样

我们不会为滤波器进行特定的初始化

池化层没有参数，只有卷积层有参数

规范化层是一个进行规范化的特殊的层，在2012年之后就不再用到了。

当在做反向传播的时候一定要注意，因为参数是共享的，当你在用滤波器做卷积时，所有的神经元都共享参数。你必须小心，所有的滤波器的梯度都汇总到一个权重。

ZFNet

基于AlexNet构建
conv1的滤波器大小、步长比AlexNet更小，对原始图像做更密集的计算。
conv3、conv4、conv5相比AlexNet有更多的过滤器

VGG NET

VGG并没有在疯狂的架构选择（例如你如何设定过滤器个数，尺寸大小，过滤器的大小等参数）上做非常多的工作，VGG的关键点在于在这个操作你重复了多少次（多少层），最后同样的这组参数设定的网络结构重复层叠至16层

VGG网络有一个非常简单的线性结构

GoogLeNet

最关键的创新点是引入了inception模块，但是它仅仅是inception模块的序列，一个接一个进行排列，他们使用的是inception层而不是卷积层，随后他们使用average pool而非全连接层，所以他们省去了大量的参数，他致力于同时减少对内存和计算量的需求。

必须小心处理增加层数，如果仅仅是简单的去做，他将没有什么用处

ResNet

大致的工作原理是我们有plain net，然后选取一张图片，接着有conv,pool,然后继续conv,conv,conv,conv.在ResNet中，在这些有趣的跳跃连接中，除了这种严格将一个容量转移到下一个容量的传递之外，我们还有这些连接。你可以将很多的信息打包进一个小的容器里。

工作方式：

在一个普通的神经网络中，你有一些函数H（x），想做一些计算，你要转换映射后的值，所以你有一个权重层，你有神经元映射后的值，你要将其转换，等等。在残差网络中，你的输入不是去计算你的变换F（x），而是计算过程中需要加上输入的残差。这个2层的神经网络需要计算的是顶部输入的原始表示，而不是一种与之前x完全没关系的表示，这个就是resent模型。

这一层基本上是由默认的恒等运算，这些建立在顶部的恒等上，他只是让他更好的优化

训练残差网络过程

gpu计算空间是这个的瓶颈

斯坦福CS231n—深度学习与计算机视觉----学习笔记课时14&&15的更多相关文章

斯坦福CS231n—深度学习与计算机视觉----学习笔记课时3
课时3 计算机视觉历史回顾与介绍下 ImageNet有5000万张图片,全部都是人工清洗过得,标注了超过2万个分类. CS231n将聚焦于视觉识别问题,图像分类关注的是大图整体:物体检测告诉你东西具体 ...
斯坦福CS231n—深度学习与计算机视觉----学习笔记课时1
课时1 计算机视觉历史回顾与介绍上 CS231n:这一一门关于计算机视觉的课程,基于一种专用的模型架构,叫做神经网络(更细一点说,是卷积神经网络CNN).计算机视觉是人工智能领域中发展最为迅猛的一个分 ...
斯坦福CS231n—深度学习与计算机视觉----学习笔记课时26&&27
课时26 图像分割与注意力模型(上) 语义分割:我们有输入图像和固定的几个图像分类,任务是我们想要输入一个图像,然后我们要标记每个像素所属的标签为固定数据类中的一个使用卷积神经,网络为每个小区块进行 ...
斯坦福CS231n—深度学习与计算机视觉----学习笔记课时24&&25
课时24 深度学习开源库使用介绍(上) Caffe 被用于重新实现AlexNet,然后用AlexNet的特征来解决其他事情用C++书写的,可以去GitHub上面读取源代码主要四个类: Blob可以 ...
斯坦福CS231n—深度学习与计算机视觉----学习笔记课时8&&9
课时8 反向传播与神经网络初步(上) 反向传播在运算连路中,这是一种通过链式法则来进行递推的计算过程,这个链路中的每一个中间变量都会对最终的损失函数产生影响. 链式法则通常包含两部分,局部梯度和后一层 ...
斯坦福CS231n—深度学习与计算机视觉----学习笔记课时12&&13
课时12 神经网络训练细节part2(上) 训练神经网络是由四步过程组成,你有一个完整的数据集图像和标签,从数据集中取出一小批样本,我们通过网络做前向传播得到损失,告诉我们目前分类效果怎么样.然后我们 ...
斯坦福CS231n—深度学习与计算机视觉----学习笔记课时11
课时11 神经网络训练细节part1(下) 2010年,Glorot等人写的论文,我们称之为Xavier初始化,他们关注了神经元的方差表达式.他们推荐一种初始化方式,那就是对每个神经元的输入进行开根号 ...
斯坦福CS231n—深度学习与计算机视觉----学习笔记课时10
课时10 神经网络训练细节part1(上) 没有大量的数据也不会有太多影响,只需要找一个经过预训练的卷积神经网络然后进行调整从数据集中抽样一小批数据, 将数据运入卷积神经网络中来计算损失值通过反向 ...
斯坦福CS231n—深度学习与计算机视觉----学习笔记课时7
课时7 线性分类器损失函数与最优化(下) 我们为什么要最大化对数概率而非直接最大化概率? 你在做逻辑斯蒂回归时,如果你只是想要最大化概率,那你使用log是无意义的.因为log函数是单调函数,最大化概率 ...

随机推荐

python实现网速控制，限制上传下载速度
对于python的web,比如flask使用的werkzeug,首先找到wsgi的请求和响应的代码,使用算法实现大文件的小速率上传和下载考虑python实现socket限流关于限速的讨论:http ...
OD调试器调试Delphi程序按钮事件断点方法
这几天我调试一个Delphi程序,总是无法断点按钮事件,像我这样的菜鸟断点按钮事件真心累啊.所以我分享一下我下断点的经验!希望新手们少走弯路!! 工具/原料 OD调试器 Delphi程序方法 ...
【Todo】已经打开的页面需要清掉的坑
下面是当前我浏览器里面打开的技术文章.需要清掉.一个坑一个坑地填吧. 微信文件传输里面也有几篇12.6号的<Akuna Capital电面面经><2016最流行的Java EE服务器 ...
33.JAVA编程思想——JAVA IO File类
33.JAVA编程思想--JAVA IO File类 RandomAccessFile用于包括了已知长度记录的文件.以便我们能用 seek()从一条记录移至还有一条:然后读取或改动那些记录. 各记录的 ...
leetcode最长递增子序列问题
题目描写叙述: 给定一个数组,删除最少的元素,保证剩下的元素是递增有序的. 分析: 题目的意思是删除最少的元素.保证剩下的元素是递增有序的,事实上换一种方式想,就是寻找最长的递增有序序列.解法有非常多 ...
centos 7 -- Disk Requirements: At least 134MB more space needed on the / filesystem.
用了幾年的centos7,今天執行yum update時,彈出一行有錯誤的提示:Disk Requirements: At least 134MB more space needed on the ...
SolidEdge如何绘制阵列之后取消掉某一些
在最后一步点击"抑制事件",然后可以在被阵列的圆形上单击,被抑制的圆形变成灰色
HTML--比较实用的小例子
常用的前端实例: 1略 2.在网页商城中的图片当我们把鼠标放上去之后,图片会显示一个有颜色的外边框,图片某一部分的字体的颜色并发生改变鼠标放上去之前鼠标放上去之后: 实现的代码: <!DOC ...
@SuppressWarnings 用法
从Java 5.0起,您可以使用java.lang.SuppressWarning注释,来停用与编译单元子集相关的编译警告作用:用于抑制编译器产生警告信息. Idea 设置泛型检查,变量.方法未使用 ...
回溯法——求解N皇后问题
问题描写叙述八皇后问题是十九世纪著名数学家高斯于1850年提出的.问题是:在8*8的棋盘上摆放8个皇后.使其不能互相攻击,即随意的两个皇后不能处在允许行.同一列,或允许斜线上. 能够把八皇后问题拓展 ...

斯坦福CS231n—深度学习与计算机视觉----学习笔记 课时14&&15