cs231n--详解卷积神经网络

coldyan 2024-11-06 08:24:40 原文

原版地址：http://cs231n.github.io/convolutional-networks/

知乎翻译地址：https://zhuanlan.zhihu.com/p/22038289?refer=intelligentunit

1 卷积层

（1）理解卷积层

按照卷积的观点看，卷积层由若干卷积核（滤波器）组成，核的参数待学习，将卷积核在输入上滑动相乘，得到的输出称为激活图。假设输入数据体的尺寸为 $W_1\times H_1\times D_1$ 。4个超参数为：滤波器的数量 $K$ ，滤波器的空间尺寸 $F$ ，步长 $S$ ，零填充数量 $P$ 。则输出数据体的尺寸为 $W_2\times H_2\times D_2$ ，其中： $W_2=(W_1-F+2P)/S+1$ ， $H_2=(H_1-F+2P)/S+1$ ， $D_2=K$ 。

按照神经元的观点看，卷积层中神经元的一个深度切片是共享参数的，并且它们只连接到输入的一部分（称为感受野），每个神经元突触的权重就是滤波器。不同深度上的神经元是不共享参数的。也就是说，同一个深度切面上的所有神经元都学习同样的特征，不同深度上的神经元学习不同的特征。由于图像具有平移不变性，因此共享参数是合理的，处于同一深度切面上的神经元是在图像不同位置上检测相同的特征。

（2）实现

普通实现，矩阵乘法实现。详细见https://zhuanlan.zhihu.com/p/22038289?refer=intelligentunit

2 pooling层

pooling层也有一个滑动的滤波器，但是不含参数，只是对输入做降采样，通常是取窗口内的最大值操作。

3 全连接层转化成卷积层

全连接层可以看作卷积层，这种转化的好处是可以用一次前向传播对更大图像的不同位置打分，而如果不做这种转化，就需要输入在大图像上不同位置滑动，经过多次前向传播，才能获得不同位置的打分。

4 结构

常见的卷积网络结构为：INPUT -> [[CONV -> RELU]*N -> POOL?]*M -> [FC -> RELU]*K -> FC

5 层结构及超参数的设置规律

详见https://zhuanlan.zhihu.com/p/22038289?refer=intelligentunit

cs231n--详解卷积神经网络的更多相关文章

详解卷积神经网络(CNN)
详解卷积神经网络(CNN) 详解卷积神经网络CNN 概揽 Layers used to build ConvNets 卷积层Convolutional layer 池化层Pooling Layer 全 ...
详解卷积神经网络（CNN）在语音识别中的应用
欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 作者:侯艺馨前言总结目前语音识别的发展现状,dnn.rnn/lstm和cnn算是语音识别中几个比较主流的方向.2012年,微软邓力和俞栋老 ...
『cs231n』卷积神经网络的可视化与进一步理解
cs231n的第18课理解起来很吃力,听后又查了一些资料才算是勉强弄懂,所以这里贴一篇博文(根据自己理解有所修改)和原论文的翻译加深加深理解,其中原论文翻译比博文更容易理解,但是太长,而博文是业者而非 ...
Andrej Karpathy | 详解神经网络和反向传播（基于 micrograd）
只要你懂 Python,大概记得高中学过的求导知识,看完这个视频你还不理解反向传播和神经网络核心要点的话,那我就吃鞋:D Andrej Karpathy,前特斯拉 AI 高级总监.曾设计并担任斯坦福深 ...
用反卷积（Deconvnet）可视化理解卷积神经网络还有使用tensorboard
『cs231n』卷积神经网络的可视化与进一步理解深度学习小白——卷积神经网络可视化(二) TensorBoard--TensorFlow可视化原文地址:http://blog.csdn.net/h ...
【cs231n】卷积神经网络
较好的讲解博客: 卷积神经网络基础深度卷积模型目标检测人脸识别与神经风格迁移译者注:本文翻译自斯坦福CS231n课程笔记ConvNet notes,由课程教师Andrej Karpathy授权 ...
『cs231n』循环神经网络RNN
循环神经网络循环神经网络介绍摘抄自莫凡博士的教程序列数据我们想象现在有一组序列数据 data 0,1,2,3. 在当预测 result0 的时候,我们基于的是 data0, 同样在预测其他数据的 ...
『cs231n』卷积神经网络工程实践技巧_下
概述计算加速方法一: 由于计算机计算矩阵乘法速度非常快,所以这是一个虽然提高内存消耗但是计算速度显著上升的方法,把feature map中的感受野(包含重叠的部分,所以会加大内存消耗)和卷积核全部 ...
『cs231n』卷积神经网络工程实践技巧_上
概述数据增强思路:在训练的时候引入干扰,在测试的时候避免干扰. 翻转图片增强数据. 随机裁切图片后调整大小用于训练,测试时先图像金字塔制作不同尺寸,然后对每个尺寸在固定位置裁切固定大小进入训练,最 ...

随机推荐

MySql中的SHOW INDEX 查出的结果列代表的意义
MySQL SHOW INDEX语法的实际操作用法以及其实际查看索引状态(语法)的具体内容的描述,如果你对这一技术,心存好奇的话,以下的文章将会揭开它的神秘面纱. INDEX FROM tbl_nam ...
Python入门基础(7)
这一篇来介绍一下函数里面的一些东西函数的参数必须参数:必须参数必须以正确的顺序传入函数.调用时的数据必须和声明时的一样如果根据参数名来传入参数值,则无须遵守定义形参的顺序,这种方式被称为关键字( ...
python爬取新浪股票数据—绘图【原创分享】
目标:不做蜡烛图,只用折线图绘图,绘出四条线之间的关系. 注:未使用接口,仅爬虫学习,不做任何违法操作. """ 新浪财经,爬取历史股票数据 ""&q ...
nginx的access.log 和 error.log
nginx 常用的配置文件有两种: access.log 和 error.log access.log 的作用是记录用户所有的访问请求,不论状态码,包括200 ,404,500等请求,404,500 ...
Android基础知识复习之打开照相机拍照并获取照片
对于我来说,做一件事情: 首先要理清我的思路,我要打开照相机,我能想到的是:在Android中我要打开系统应用,肯定需要一个隐式意图,那就要查询Android照相机的源码,查看并找到意图过滤器的书写方 ...
jmeter使用问题——将接口返回变量存储成csv文件
在使用jmeter做接口测试时,一整个jmx测试计划中,存在多个线程,多个接口的测试但是接口可以分类,比如业务接口.查询接口.更新接口等考虑自动化接口测试一般都是一次性的,有完整的闭环链路,一般步 ...
使用c++开发跨平台的程序
使用c++开发跨平台的程序背景在开发过程中,使用c++作为开发语言,通常被认为是痛苦的,啰嗦的,超长开发时间的.最近几年有各种各样的语言被广泛使用,相对比来说c++不是那么出彩.c++虽然年龄大, ...
C#写进程守护程序
最近写了好多次进程守护程序,今天在这里总结一下. 用到的知识点: 1.在程序中启动进程, 2.写Windows服务, 3.以及在Windows服务中启动带界面的程序关于第三点的问题,我在我的上一篇博 ...
IT技术人员的自我修养
1. 前言在IT领域摸爬滚打多年,从一个普通程序员到技术主管,到技术经理,再到技术总监,踩过不少坑.加过不少班,也背过不少锅,在提升自身技术能力与管理能力的同时,也一直在思考,作为IT ...
git 必看，各种撤销操作
场景概念说明首先说明一个概念, git是一个分布式的版本控制工具,分布式即 git 管理的项目是有多个大致平等的仓库的.通过一个例子来说明这个东西. 举一个最简单的使用场景: 你在github 建立 ...