详解简单卷积网络示例

假设有一张图片，想做图片分类或图片识别，把这张图片输入定义为\(x\)，然后辨别图片中有没有猫，用0或1表示，这是一个分类问题，来构建适用于这项任务的卷积神经网络。针对这个示例，用了一张比较小的图片，大小是39×39×3，这样设定可以使其中一些数字效果更好。所以\(n_{H}^{[0]} = n_{W}^{[0]}\)，即高度和宽度都等于39，\(n_{c}^{[0]} =3\)，即0层的通道数为3。

假设第一层用一个3×3的过滤器来提取特征，那么\(f^{[1]} = 3\)，因为过滤器时3×3的矩阵。\(s^{[1]} = 1\)，\(p^{[1]} =0\)，所以高度和宽度使用valid卷积。如果有10个过滤器，神经网络下一层的激活值为37×37×10，写10是因为用了10个过滤器，37是公式\(\frac{n + 2p - f}{s} + 1\)的计算结果，也就是\(\frac{39 + 0 - 3}{1} + 1 = 37\)，所以输出是37×37，它是一个vaild卷积，这是输出结果的大小。第一层标记为\(n_{H}^{[1]} = n_{W}^{[1]} = 37\)，\(n_{c}^{[1]} = 10\)，\(n_{c}^{[1]}\)等于第一层中过滤器的个数，这（37×37×10）是第一层激活值的维度。

假设还有另外一个卷积层，这次采用的过滤器是5×5的矩阵。在标记法中，神经网络下一层的\(f=5\)，即\(f^{\left\lbrack 2 \right\rbrack} = 5\)步幅为2，即\(s^{\left\lbrack 2 \right\rbrack} = 2\)。padding为0，即\(p^{\left\lbrack 2 \right\rbrack} = 0\)，且有20个过滤器。所以其输出结果会是一张新图像，这次的输出结果为17×17×20，因为步幅是2，维度缩小得很快，大小从37×37减小到17×17，减小了一半还多，过滤器是20个，所以通道数也是20，17×17×20即激活值\(a^{\left\lbrack 2 \right\rbrack}\)的维度。因此\(n_{H}^{\left\lbrack 2 \right\rbrack} = n_{W}^{\left\lbrack 2 \right\rbrack} = 17\)，\(n_{c}^{\left\lbrack 2 \right\rbrack} = 20\)。

来构建最后一个卷积层，假设过滤器还是5×5，步幅为2，即\(f^{\left\lbrack 2 \right\rbrack} = 5\)，\(s^{\left\lbrack 3 \right\rbrack} = 2\)，计算过程跳过了，最后输出为7×7×40，假设使用了40个过滤器。padding为0，40个过滤器，最后结果为7×7×40。

到此，这张39×39×3的输入图像就处理完毕了，为图片提取了7×7×40个特征，计算出来就是1960个特征。然后对该卷积进行处理，可以将其平滑或展开成1960个单元。平滑处理后可以输出一个向量，其填充内容是logistic回归单元还是softmax回归单元，完全取决于是想识图片上有没有猫，还是想识别\(K\)种不同对象中的一种，用\(\hat y\)表示最终神经网络的预测输出。明确一点，最后这一步是处理所有数字，即全部的1960个数字，把它们展开成一个很长的向量。为了预测最终的输出结果，把这个长向量填充到softmax回归函数中。

这是卷积神经网络的一个典型范例，设计卷积神经网络时，确定这些超参数比较费工夫。要决定过滤器的大小、步幅、padding以及使用多少个过滤器。

而要掌握的一点是，随着神经网络计算深度不断加深，通常开始时的图像也要更大一些，初始值为39×39，高度和宽度会在一段时间内保持一致，然后随着网络深度的加深而逐渐减小，从39到37，再到17，最后到7。而通道数量在增加，从3到10，再到20，最后到40。在许多其它卷积神经网络中，也可以看到这种趋势。关于如何确定这些参数，这是讲的第一个卷积神经网络示例。

一个典型的卷积神经网络通常有三层，一个是卷积层，常常用Conv来标注。上一个例子，用的就是CONV。还有两种常见类型的层，一个是池化层，称之为POOL。最后一个是全连接层，用FC表示。虽然仅用卷积层也有可能构建出很好的神经网络，但大部分神经望楼架构师依然会添加池化层和全连接层。幸运的是，池化层和全连接层比卷积层更容易设计。

神经网络之卷积篇：详解简单卷积网络示例（A simple convolution network example）的更多相关文章

走向DBA[MSSQL篇] 详解游标
原文:走向DBA[MSSQL篇] 详解游标前篇回顾:上一篇虫子介绍了一些不常用的数据过滤方式,本篇详细介绍下游标. 概念简单点说游标的作用就是存储一个结果集,并根据语法将这个结果集的数据逐条处理. ...
基于双向BiLstm神经网络的中文分词详解及源码
基于双向BiLstm神经网络的中文分词详解及源码基于双向BiLstm神经网络的中文分词详解及源码 1 标注序列 2 训练网络 3 Viterbi算法求解最优路径 4 keras代码讲解最后源代码 ...
PHP函数篇详解十进制、二进制、八进制和十六进制转换函数说明
PHP函数篇详解十进制.二进制.八进制和十六进制转换函数说明作者: 字体:[增加减小] 类型:转载中文字符编码研究系列第一期,PHP函数篇详解十进制.二进制.八进制和十六进制互相转换函数说明 ...
Scala进阶之路-Scala函数篇详解
Scala进阶之路-Scala函数篇详解作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.传值调用和传名调用 /* @author :yinzhengjie Blog:http: ...
ls（list）命令详解及生产使用示例
文件有文件名与数据,在linux上被分为两个部分:用户数据(user data)与元数据(metadata) 用户数据,即文件数据块(data block),数据块是记录文件真实内容的地方,我们将其称 ...
神经网络基础部件-BN层详解
一,数学基础 1.1,概率密度函数 1.2,正态分布二,背景 2.1,如何理解 Internal Covariate Shift 2.2,Internal Covariate Shift 带来的问题 ...
window64 PHP ffmpeg详解简单上手音频amr转mp3
从网上找了一大堆关于window 64 ffmpeg的信息,都是又长又不关键,让人难消化. 我只要简单的amr转MP3格式而已. 终于搞明白.自己总结了下! 希望能帮助到喜欢言简意赅,一眼上手的同学. ...
Canal：同步mysql增量数据工具，一篇详解核心知识点
老刘是一名即将找工作的研二学生,写博客一方面是总结大数据开发的知识点,一方面是希望能够帮助伙伴让自学从此不求人.由于老刘是自学大数据开发,博客中肯定会存在一些不足,还希望大家能够批评指正,让我们一起进 ...
java提高篇-----详解java的四舍五入与保留位
转载:http://blog.csdn.net/chenssy/article/details/12719811 四舍五入是我们小学的数学问题,这个问题对于我们程序猿来说就类似于1到10的加减乘除那么 ...
<泛> C++3D数学库设计详解简单光学几何 && 随机向量生成
// 注:本内容为作者原创,禁止在其他网站复述内容以及用于商业盈利,如需引用,请标明出处:http://www.cnblogs.com/lv_anchoret/ Preface 当初写这个库,是为了 ...

随机推荐

解读MySQL 8.0数据字典缓存管理机制
背景介绍 MySQL的数据字典(Data Dictionary,简称DD),用于存储数据库的元数据信息,它在8.0版本中被重新设计和实现,通过将所有DD数据唯一地持久化到InnoDB存储引擎的DD t ...
014_用vim复制粘贴_保持双手正位
[oeasy]python0014_用vim复制粘贴_保持双手正位继续运行回忆上次内容程序员还是很可爱的要关心身边的程序员啊毕竟是新时代的典型新职业文明主流职业血型 ...
oeasy教您玩转vim - 39 - # 剪切粘贴
剪切粘贴回忆上节课内容我们大幅度地复习了整个 motion: 直接运动 h j k l 行运动首行g g 末行G 第n行n G 单词运动 wbe w 是到下一个 word 的开头 b 是到当 ...
JAVA私有构造函数---java笔记
在Java中,构造函数是一种特殊的方法,它用于初始化新创建的对象.当我们创建一个类的实例时,构造函数会自动被调用. 构造函数可以有不同的访问修饰符,如public.protected.default( ...
Java学习_重置版一：Java语言基础之数据和标识符等
第一:关键字 (1)被Java语言赋予特定含义的单词 (2)特点:全部小写. (3)注意事项: A:goto和const作为保留字存在. B:类似于Notepad++这 ...
矩阵的奇异值分解（SVD）及其应用
奇异值分解(Singular Value Decomposition, SVD)是矩阵的一种分解方法,与特征值分解不同,它可以应用于长方矩阵中,并将其分解成三个特殊矩阵的乘积.此外SVD分解还具有许多 ...
使用Nginx Proxy Manager配置Halo的反向代理和申请 SSL 证书
本文介绍Nginx Proxy Manager配置Halo的反向代理和申请 SSL 证书,如需要了解Halo 2的安装,参考如何在Linux云服务器上通过Docker Compose部署安装Halo, ...
web3产品介绍：mask将Web3的隐私和优势引入像Facebook和Twitter这样的社交媒体平台
介绍: Mask Network是一个开源的浏览器扩展,将Web3的隐私和优势引入像Facebook和Twitter这样的社交媒体平台.它是一个功能强大的工具,允许用户在社交媒体上享受区块链的隐私保护 ...
【MySQL】下发功能SQL
SQL参考文章: https://www.jb51.net/article/15627.htm 下发,就是从别的表中同步数据到此表中,也可能是来自不同库的表,或者不同实例的表下发的逻辑要求:如果没有 ...
【Vue】01 基础语法
Hello Vue的演示案例: <!DOCTYPE html> <html lang="en" xmlns:v-bind="http://www.w3. ...

神经网络之卷积篇：详解简单卷积网络示例（A simple convolution network example）

详解简单卷积网络示例

神经网络之卷积篇：详解简单卷积网络示例（A simple convolution network example）的更多相关文章

随机推荐

热门专题