CS231n笔记 Lecture 5 Convolutional Neural Networks

zhsuiy 2024-09-03 15:11:30 原文

一些ConvNets的应用

Face recognition
输入人脸，推测是谁
Video classfication
Recognition
识别身体的部位, 医学图像, 星空, 标志牌, 鲸...
图像描述 Image Captioning
transfer

卷积操作和信号处理的卷积操作的区别

印象中在学习数字图像处理这门课的时候，里面提到过卷积操作，当时的计算方法是，需要把卷积核作一个180度的旋转。其实在最开始听到“卷积神经网络“并开始在探究具体如何进行卷积操作的时候，我也有过这个疑惑，这里的卷积需要旋转吗?但是我当时不求甚解，没有深入地探查到底为什么。今天的课上，有一个同学把这个问题问了出来，Serena的回答是，我们在CNN里用的卷积实际上就是一个element wise的操作，只是思想上和信号处理的卷积相似，但具体计算还是有所区别了。感觉得到了官方的回复，这下可以少一些疑虑了。

卷积操作

计算

filter也是带有深度的，只是在很多时候这个*3被省略了。
但是，在经过一次计算后，这个深度信息（3）就没有了，或者是说被重新映射了，深度的个数取决于filter的个数。

输入输出的维度计算

这里需要注意的是，输出的图像为323210，此时已经没有所谓的rgb，新的通道个数为10，这是因为用了10个filter来做卷积。

参数个数

参数个数实际上就是filter里面元素的个数，由于共有10个55filter，且每个filter实际上是55*3的，外加1个bias项，所以总共的参数个数是760。

pooling

只spatially变小，depth保持不变。

为什么要用max pooling而不是average pooling？

因为每个region实际上是记录了一个激活强度，用max的话可以把这个激活强度最大程度地保留。（存疑）

为什么不直接用stride来做down sampling

当我们设置stride时，output的维度也会降低，Serena解释说这二者其实并没有太多本质的区别，而且最新的网络，大家也开始尝试用stride代替pooling来做down sampling.

CS231n笔记 Lecture 5 Convolutional Neural Networks的更多相关文章

【论文笔记】Learning Convolutional Neural Networks for Graphs
Learning Convolutional Neural Networks for Graphs 2018-01-17 21:41:57 [Introduction] 这篇 paper 是发表在 ...
论文笔记——MobileNets(Efficient Convolutional Neural Networks for Mobile Vision Applications)
论文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications MobileNet由Go ...
cs231n spring 2017 lecture5 Convolutional Neural Networks听课笔记
1. 之前课程里,一个32*32*3的图像被展成3072*1的向量,左乘大小为10*3072的权重矩阵W,可以得到一个10*1的得分,分别对应10类标签. 在Convolution Layer里,图像 ...
cs231n spring 2017 lecture5 Convolutional Neural Networks
1. 之前课程里,一个32*32*3的图像被展成3072*1的向量,左乘大小为10*3072的权重矩阵W,可以得到一个10*1的得分,分别对应10类标签. 在Convolution Layer里,图像 ...
深度学习笔记 (一) 卷积神经网络基础 (Foundation of Convolutional Neural Networks)
一.卷积卷积神经网络(Convolutional Neural Networks)是一种在空间上共享参数的神经网络.使用数层卷积,而不是数层的矩阵相乘.在图像的处理过程中,每一张图片都可以看成一张“ ...
阅读笔记 The Impact of Imbalanced Training Data for Convolutional Neural Networks [DegreeProject2015] 数据分析型
The Impact of Imbalanced Training Data for Convolutional Neural Networks Paulina Hensman and David M ...
论文笔记之：Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking
Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking arXiv Paper ...
论文笔记之：Learning Multi-Domain Convolutional Neural Networks for Visual Tracking
Learning Multi-Domain Convolutional Neural Networks for Visual Tracking CVPR 2016 本文提出了一种新的CNN 框架来处理 ...
[CVPR2015] Is object localization for free? – Weakly-supervised learning with convolutional neural networks论文笔记
p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #323333 } p. ...

随机推荐

Netweaver和CloudFoundry的服务器日志
Netweaver 事务码SMICM,Goto->HTTP Plug-In->Server Logs: CloudFoundry 假设我部署本地应用到CloudFoundry之后,应用的状 ...
重温Javascript（三）-继承
继承 1.原型链继承基本思想是利用原型让一个引用类型继承另一个引用类型的属性和方法.每个构造函数都有一个原型对象,原型对象都包含一个指向构造函数的指针,而实例都包含一个指向原型对象的内部指针.让原型 ...
陆教授浅谈5G毫米波手机天线技术的发展现状和未来的应用场景
近日,香港城大电子工程学系讲座教授陆贵文教授荣获英国皇家工程院院士荣衔,以表彰他在推动天线研究的卓越贡献.他研发的天线由L形探针馈电微带天线.磁电耦极天线,以至5G毫米波手机天线等技术,均在天线领域影 ...
vue中的修饰符
Vue2.0学习笔记:Vue事件修饰符的使用事件处理如果需要在内联语句处理器中访问原生DOM事件.可以使用特殊变量$event,把它传入到methods中的方法中. 在Vue中,事件修饰符处理 ...
禁止DataGridView控件中添加和删除行
实现效果: 知识运用: DataGridView控件的AllowUserToAddRows AllowUserDeleteRows和ReadOnly属性实现代码: private void btn_ ...
常用的CSS居中方式
1.水平居中margin 0 auto;(浮动元素除外) 这个属性在网页制作的过程中是经常被用到的,一般情况下页面的版心你就可以看到它. <style> .father { width: ...
安装搭配VUE使用的UI框架ElementUI
可以搭配vue的UI框架有几个,我用的是element-ui,现在呢,我要在复习一遍 1.vue init webpack-simple element-ui2.cd element-ui3.npm ...
03_5_static关键字
03_5_static关键字 1. static关键字在类中,用static声明的成员变量为静态成员变量,它为该类的公用变量,在第一次使用时被初始化,对于该类的所有对象来说,static成员变量只 ...
Android读书笔记二
本章讲到需要Android应用程序以及Android NDK程序来测试Linux驱动,所以所需要的工具都必须配备好.而且对工具的版本也是有一些要求,JDK,Eclipse,ADT,CDT,Androi ...
2829: 高精A+B [1*+]
题目描述输入A和B,计算A+B的值 Input 两行数据,分别是A和B 0<=A<=1E200 0<=B<=10^200 Output A+B的结果 Sample Input ...