cs231n--详解卷积神经网络

coldyan 2024-11-06 08:24:40 原文

原版地址：http://cs231n.github.io/convolutional-networks/

知乎翻译地址：https://zhuanlan.zhihu.com/p/22038289?refer=intelligentunit

1 卷积层

（1）理解卷积层

按照卷积的观点看，卷积层由若干卷积核（滤波器）组成，核的参数待学习，将卷积核在输入上滑动相乘，得到的输出称为激活图。假设输入数据体的尺寸为 $W_1\times H_1\times D_1$ 。4个超参数为：滤波器的数量 $K$ ，滤波器的空间尺寸 $F$ ，步长 $S$ ，零填充数量 $P$ 。则输出数据体的尺寸为 $W_2\times H_2\times D_2$ ，其中： $W_2=(W_1-F+2P)/S+1$ ， $H_2=(H_1-F+2P)/S+1$ ， $D_2=K$ 。

按照神经元的观点看，卷积层中神经元的一个深度切片是共享参数的，并且它们只连接到输入的一部分（称为感受野），每个神经元突触的权重就是滤波器。不同深度上的神经元是不共享参数的。也就是说，同一个深度切面上的所有神经元都学习同样的特征，不同深度上的神经元学习不同的特征。由于图像具有平移不变性，因此共享参数是合理的，处于同一深度切面上的神经元是在图像不同位置上检测相同的特征。

（2）实现

普通实现，矩阵乘法实现。详细见https://zhuanlan.zhihu.com/p/22038289?refer=intelligentunit

2 pooling层

pooling层也有一个滑动的滤波器，但是不含参数，只是对输入做降采样，通常是取窗口内的最大值操作。

3 全连接层转化成卷积层

全连接层可以看作卷积层，这种转化的好处是可以用一次前向传播对更大图像的不同位置打分，而如果不做这种转化，就需要输入在大图像上不同位置滑动，经过多次前向传播，才能获得不同位置的打分。

4 结构

常见的卷积网络结构为：INPUT -> [[CONV -> RELU]*N -> POOL?]*M -> [FC -> RELU]*K -> FC

5 层结构及超参数的设置规律

详见https://zhuanlan.zhihu.com/p/22038289?refer=intelligentunit

cs231n--详解卷积神经网络的更多相关文章

详解卷积神经网络(CNN)
详解卷积神经网络(CNN) 详解卷积神经网络CNN 概揽 Layers used to build ConvNets 卷积层Convolutional layer 池化层Pooling Layer 全 ...
详解卷积神经网络（CNN）在语音识别中的应用
欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 作者:侯艺馨前言总结目前语音识别的发展现状,dnn.rnn/lstm和cnn算是语音识别中几个比较主流的方向.2012年,微软邓力和俞栋老 ...
『cs231n』卷积神经网络的可视化与进一步理解
cs231n的第18课理解起来很吃力,听后又查了一些资料才算是勉强弄懂,所以这里贴一篇博文(根据自己理解有所修改)和原论文的翻译加深加深理解,其中原论文翻译比博文更容易理解,但是太长,而博文是业者而非 ...
Andrej Karpathy | 详解神经网络和反向传播（基于 micrograd）
只要你懂 Python,大概记得高中学过的求导知识,看完这个视频你还不理解反向传播和神经网络核心要点的话,那我就吃鞋:D Andrej Karpathy,前特斯拉 AI 高级总监.曾设计并担任斯坦福深 ...
用反卷积（Deconvnet）可视化理解卷积神经网络还有使用tensorboard
『cs231n』卷积神经网络的可视化与进一步理解深度学习小白——卷积神经网络可视化(二) TensorBoard--TensorFlow可视化原文地址:http://blog.csdn.net/h ...
【cs231n】卷积神经网络
较好的讲解博客: 卷积神经网络基础深度卷积模型目标检测人脸识别与神经风格迁移译者注:本文翻译自斯坦福CS231n课程笔记ConvNet notes,由课程教师Andrej Karpathy授权 ...
『cs231n』循环神经网络RNN
循环神经网络循环神经网络介绍摘抄自莫凡博士的教程序列数据我们想象现在有一组序列数据 data 0,1,2,3. 在当预测 result0 的时候,我们基于的是 data0, 同样在预测其他数据的 ...
『cs231n』卷积神经网络工程实践技巧_下
概述计算加速方法一: 由于计算机计算矩阵乘法速度非常快,所以这是一个虽然提高内存消耗但是计算速度显著上升的方法,把feature map中的感受野(包含重叠的部分,所以会加大内存消耗)和卷积核全部 ...
『cs231n』卷积神经网络工程实践技巧_上
概述数据增强思路:在训练的时候引入干扰,在测试的时候避免干扰. 翻转图片增强数据. 随机裁切图片后调整大小用于训练,测试时先图像金字塔制作不同尺寸,然后对每个尺寸在固定位置裁切固定大小进入训练,最 ...

随机推荐

Jenkins+SVN+Maven+shell 自动化部署实践
JAVA环境中利用Jenkins+svn+maven进行自动化部署实践一. 前言2 1.介绍jenkins2 1.本地项目打包2 2.通过secureCRT工具,手动传输到服务器2 3.然后 ...
Bzoj 3165 [Heoi2013]Segment题解
3165: [Heoi2013]Segment Time Limit: 40 Sec Memory Limit: 256 MBSubmit: 668 Solved: 276[Submit][Sta ...
linux应用程序设计--GCC程序编译
GCC程序编译 linux系统下的GCC(GNU C Compiler)是GNU推出的功能强大.性能优越的多平台编译器,是GNU的代表作之一.GCC可以在多种硬件平台上编译出可执行程序,其执行效率与一 ...
五分钟了解Zabbix
Zabbix-简介 Zabbix概念 Zabbix组成 Server Zabbix server 是 Zabbix agent 向其报告可用性.系统完整性信息和统计信息的核心组件.是存储所有配置信息. ...
洛谷 P1311 【选择客栈】
枚举在那个咖啡店喝咖啡想要计算咖啡店两侧同色的客栈的对数枚举i求和(左边第i种颜色的个数*右边第i种颜色的个数) 前缀和+后缀和 f[i][j]f[i][j]f[i][j]表示到第i家客栈及之前颜 ...
跟着大彬读源码 - Redis 5 - 对象和数据类型（上）
相信很多人应该都知道 Redis 有五种数据类型:字符串.列表.哈希.集合和有序集合.但这五种数据类型是什么含义?Redis 的数据又是怎样存储的?今天我们一起来认识下 Redis 这五种数据结构的含 ...
小白开学Asp.Net Core《二》
小白开学Asp.Net Core<二> ——数据仓储层(Repositroy) 一.历史现象在后端开发中,数据库操作是最频繁的,每一个开发人员都会接触,甚至不少开发人员每天的工作就是与数 ...
Python入门基础(9)__面向对象编程_3
继承子类自动继承父类的所有方法和属性继承的语法: class 类名(父类名) pass 1.子类继承父类,可以直接使用父类中已经封装好的方法,不需要再次开发 2.子类可以根据需求,封装自己特有的属 ...
java练习---9
//程序员:罗元昊 2017.10.22 package cn.lyh; import com.rupeng.game.GameCore; public class L implements Runn ...
恢复在iterm2中当滚动光标时候触发滚动历史记录的问题
在Iterm2中,如果你上下滚动光标(上下滑动触摸板.或者滚动鼠标滚轮),通常情况下是触发了屏幕内容上下滚动. 但是在某些异常情况下,却触发了命令行历史记录的上下滚动,效果和你连续按了多次键盘的上下键 ...