CS231n笔记 Lecture 5 Convolutional Neural Networks

zhsuiy 2024-09-03 15:11:30 原文

一些ConvNets的应用

Face recognition
输入人脸，推测是谁
Video classfication
Recognition
识别身体的部位, 医学图像, 星空, 标志牌, 鲸...
图像描述 Image Captioning
transfer

卷积操作和信号处理的卷积操作的区别

印象中在学习数字图像处理这门课的时候，里面提到过卷积操作，当时的计算方法是，需要把卷积核作一个180度的旋转。其实在最开始听到“卷积神经网络“并开始在探究具体如何进行卷积操作的时候，我也有过这个疑惑，这里的卷积需要旋转吗?但是我当时不求甚解，没有深入地探查到底为什么。今天的课上，有一个同学把这个问题问了出来，Serena的回答是，我们在CNN里用的卷积实际上就是一个element wise的操作，只是思想上和信号处理的卷积相似，但具体计算还是有所区别了。感觉得到了官方的回复，这下可以少一些疑虑了。

卷积操作

计算

filter也是带有深度的，只是在很多时候这个*3被省略了。
但是，在经过一次计算后，这个深度信息（3）就没有了，或者是说被重新映射了，深度的个数取决于filter的个数。

输入输出的维度计算

这里需要注意的是，输出的图像为323210，此时已经没有所谓的rgb，新的通道个数为10，这是因为用了10个filter来做卷积。

参数个数

参数个数实际上就是filter里面元素的个数，由于共有10个55filter，且每个filter实际上是55*3的，外加1个bias项，所以总共的参数个数是760。

pooling

只spatially变小，depth保持不变。

为什么要用max pooling而不是average pooling？

因为每个region实际上是记录了一个激活强度，用max的话可以把这个激活强度最大程度地保留。（存疑）

为什么不直接用stride来做down sampling

当我们设置stride时，output的维度也会降低，Serena解释说这二者其实并没有太多本质的区别，而且最新的网络，大家也开始尝试用stride代替pooling来做down sampling.

CS231n笔记 Lecture 5 Convolutional Neural Networks的更多相关文章

【论文笔记】Learning Convolutional Neural Networks for Graphs
Learning Convolutional Neural Networks for Graphs 2018-01-17 21:41:57 [Introduction] 这篇 paper 是发表在 ...
论文笔记——MobileNets(Efficient Convolutional Neural Networks for Mobile Vision Applications)
论文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications MobileNet由Go ...
cs231n spring 2017 lecture5 Convolutional Neural Networks听课笔记
1. 之前课程里,一个32*32*3的图像被展成3072*1的向量,左乘大小为10*3072的权重矩阵W,可以得到一个10*1的得分,分别对应10类标签. 在Convolution Layer里,图像 ...
cs231n spring 2017 lecture5 Convolutional Neural Networks
1. 之前课程里,一个32*32*3的图像被展成3072*1的向量,左乘大小为10*3072的权重矩阵W,可以得到一个10*1的得分,分别对应10类标签. 在Convolution Layer里,图像 ...
深度学习笔记 (一) 卷积神经网络基础 (Foundation of Convolutional Neural Networks)
一.卷积卷积神经网络(Convolutional Neural Networks)是一种在空间上共享参数的神经网络.使用数层卷积,而不是数层的矩阵相乘.在图像的处理过程中,每一张图片都可以看成一张“ ...
阅读笔记 The Impact of Imbalanced Training Data for Convolutional Neural Networks [DegreeProject2015] 数据分析型
The Impact of Imbalanced Training Data for Convolutional Neural Networks Paulina Hensman and David M ...
论文笔记之：Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking
Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking arXiv Paper ...
论文笔记之：Learning Multi-Domain Convolutional Neural Networks for Visual Tracking
Learning Multi-Domain Convolutional Neural Networks for Visual Tracking CVPR 2016 本文提出了一种新的CNN 框架来处理 ...
[CVPR2015] Is object localization for free? – Weakly-supervised learning with convolutional neural networks论文笔记
p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #323333 } p. ...

随机推荐

【Python图像特征的音乐序列生成】关于数据集的分享和样例数据
数据集还在制作中,样例数据如下: 我将一条数据作为一行,X是ID,O代表了情感向量,S是速度,是一个很关键的参数,K是调式,M是节拍,L是基本拍.后面是ABC格式的序列,通过embedding化这些音 ...
C#链接mysql 新手容易出错的问题
1.Access denied for user 'root'@'DESKTOP-AN72KEI' (using password: YES) 出现这个问题的原因是因为mysql的自带用户root理论 ...
结构化查询语言-SQL
结构化查询语言(Structured Query Language)简称SQL(发音:/ˈes kjuː ˈel/ "S-Q-L"),是一种特殊目的的编程语言,是一种数据库查询和程 ...
AWVS12 防止反复注册
以管理员权限运行cmd,输入以下内容: cacls "C:\ProgramData\Acunetix\shared\license." /t /p everyone:r 如图:
2018.4.28 基于java的聊天系统（带完善）
Java聊天系统 1.Socket类 Socket(InetAddress address, int port) 创建一个流套接字并将其连接到指定 IP 地址的指定端口号. Socket(String ...
2018.4.3 Linux环境变量与变量
环境变量与变量 shell在开始执行时就已经定义了一些和系统的工作环境有关的变量,用户还可以重新定义这些变量. 环境变量可用命令env或set来查询.(DOS环境为set) 环境变量查询与显示 env ...
【启发式拆分】bzoj5200: [NWERC2017]Factor-Free Tree
和bzoj4059: [Cerc2012]Non-boring sequences非常相似 Description 一棵Factor-Free Tree是指一棵有根二叉树,每个点包含一个正整数权值,且 ...
[LUOGU] P4251 [SCOI2015]小凸玩矩阵
行列看成点,格子看成边,二分一个边权,删去大于它的边,新图上的最大流>k则答案可以更优,小于k则调整左边界. #include<algorithm> #include<iost ...
自动化运维工具——pssh
PSSH介绍 pssh是一个python编写可以在多台服务器上执行命令的工具,同时支持拷贝文件,是同类工具中很出色的.它的用法可以媲美ansible的一些简单用法,执行起来速度比ansible快它支持 ...
iPhone如何设置自定义铃声？无需连接电脑，轻松几步就搞定！
转载自: https://baijiahao.baidu.com/s?id=1594988016778457969&wfr=spider&for=pc 受够了iPhone自带的千篇一律 ...