卷积神经网络 cnnff.m程序中的前向传播算法数据分步解析

最近在学习卷积神经网络，哎，真的是一头雾水！最后决定从阅读CNN程序下手！

程序来源于GitHub的DeepLearnToolbox

由于确实缺乏理论基础，所以，先从程序的数据流入手，虽然对高手来讲，这样有点太小儿科了，但觉得对于个人理解CNN网络的结构和数据流走向有较大帮助！

下面，将要分析CNN的前向传播算法cnnff.m

本程序所用的神经网络的结构如下图的结构体net所示

结构体net

包含5层

每层的结构

这五层的结构如下：

每层的结构分别如下：

为了方便自己理解，下面，分别对每一层的输入、输出、传播分解介绍

只考虑某一批词的样本

注：所有样本集被分为numbatches批，每一批含有batchsize个样本，对于本程序而言，共有50个样本

1 第一层到第五层的数据传递

2 第1层到第2层的前面传播（l=2）：卷积操作

利用循环，分别计算第二层每个map的输出：net.layers{2}.a{j} (j=1,..,6)（这里的l=2）

下面，讨论第j次循环时，循环体内部的分步解析

（1）初始化一个三维矩阵z

z的大小为24*24*50，即第二层中每个map的尺寸
z存放的是：第二层中每个map的输入

（2）计算第2层第j个map的输入

即第1层的所有输出（i=1,…, inputmaps）对第2层的第j个输入的贡献的累加
z的计算方法是：

利用第二层的第j个map的卷积核net.layers{2}.k{i}{j}分别对第一层中的第i个map进行卷积运算(i=1,…, net.layers{1}.outputmaps)，并将得到的所有卷积结果相加
第2层的inputmaps=1
对net.layers{l}.k{i}{j}进行解释：

net.layers{l}.k：是一个元胞，有两层

net.layers{l}.k{i}：第l-1层的第i个map到第l层的所有maps的卷积核

net.layers{l}.k{i}{j}：第l-1层的第i个map到第l层的第j个map的卷积核

下面是一个例子：

第四层的卷积核元胞

第3层的第1个map到第4层的所有maps的卷积核（12）个

第3层的第1个map到第四层的第1个maps的卷积核

（3）计算第2层的第j个map的输出

第二层的第j个map的输出为net.layers{2}.a{j}=sigm(z+net.layers{l}.b{j})

即第二层的第j个map的输入z+该map的偏执项后，求sigm函数

（4）对第1层的map进行卷积操作的图例

3 第2层到第3层（l=3）：降采样操作

下面，讨论第j次循环时，循环体内部的分步解析

（1）对第二层的第j个map进行卷积运算，得到z

利用的卷积核（大小为scale*scale）如下：

（2）对z进行降采样，得到第三层的第j个map的输出

（3）如上所示的降采样过程示例如下图所示

4 第3层到第4层的前面传播（l=4）：卷积操作

利用循环，分别计算第四层每个map的输出：net.layers{4}.a{j} (j=1,..,12)（这里的l=4）

下面，讨论第j次循环时，循环体内部的分步解析

（1）初始化一个三维矩阵z

z的大小为24*24*50，即第二层中每个map的尺寸
z存放的是：第四层中每个map的输入

（2）计算第4层的第j个map的输入

即第3层的所有输出（i=1,…, inputmaps）对第4层的第j个输入的贡献的累加
z的计算方法是：

利用第4层的第j个map的卷积核net.layers{4}.k{i}{j}分别对第3层中的第i个map进行卷积运算(i=1,…, net.layers{1}.outputmaps)，并将得到的所有卷积结果相加
第4层的inputmaps=12

（3）计算第4层的第j个map的输出

第4层的第j个map的输出为net.layers{4}.a{j}=sigm(z+net.layers{4}.b{j})

即第4层的第j个map的输入z+该map的偏执项后，求sigm函数

（4）对第3层的map进行卷积操作的图例

5 第4层到第5层 (l=5)：降采样

下面，讨论第j次循环时，循环体内部的分步解析

（1）对第四层的第j个map进行卷积运算，得到z

利用的卷积核（大小为scale*scale）如下：

（2）对z进行降采样，得到第五层的第j个map的输出

（3）如上所示的降采样过程示例如下图所示

6 将第五层的map输出向量化

（1）初始化net网络中的fv（其实是新加入fv，原来输入的net中没有fv）

（2）分别对第五层的每个输出map进行向量化（一共用numel(net.layers{n}.a个输出map)

（3）对于第五层的第j个输出map

得到第五层第j个输出map的尺寸，应该是三维的，得到的三维尺寸向量存入sa中
将第五层的第j个输出map的矩阵转化为一个sa(1)*sa(2)，sa(3)大小的矩阵
并将该得到的转化矩阵接入到第五层的第j-1个输出map之后
关于矩阵fv的结构如上图所示

7 第五层向量化后传入普通神经网

第五层的向量化输出传入一个普通的神经网络，只有输入层和输出层，输入层含有192个神经元，输出层含有10个神经元，输入到输出层的权值矩阵存放在矩阵net.ffW中，在该权值矩阵作用下，该简单神经网络的输出即为最终的整个网络的输出，输出结果存放在net.o矩阵中，该矩阵大小为10*50，每一列分别表示每个输入样本得到的相应的输出

卷积神经网络 cnnff.m程序中的前向传播算法数据分步解析的更多相关文章

深度神经网络（DNN）模型与前向传播算法
深度神经网络(Deep Neural Networks, 以下简称DNN)是深度学习的基础,而要理解DNN,首先我们要理解DNN模型,下面我们就对DNN的模型与前向传播算法做一个总结. 1. 从感知机 ...
卷积神经网络(CNN)前向传播算法
在卷积神经网络(CNN)模型结构中,我们对CNN的模型结构做了总结,这里我们就在CNN的模型基础上,看看CNN的前向传播算法是什么样子的.重点会和传统的DNN比较讨论. 1. 回顾CNN的结构在上一 ...
思考卷积神经网络（CNN）中各种意义
原文:https://blog.csdn.net/aimreant/article/details/53145063 思考卷积神经网络(CNN)中各种意义只是知道CNN是不够,我们需要对其进行解剖, ...
2. CNN卷积网络-前向传播算法
1. CNN卷积网络-初识 2. CNN卷积网络-前向传播算法 3. CNN卷积网络-反向更新 1. 前言我们已经了解了CNN的结构,CNN主要结构有输入层,一些卷积层和池化层,后面是DNN全连接层 ...
在DevExpress程序中使用PopupContainerEdit和PopupContainer实现数据展示
在一些数据的即时查询场景中,我们可能需要对输入信息进行模糊查询并进行选择,例如在一些文本输入场景,如输入某个站点编码或者设备编码,然后获取符合的列表供用户选择的场景,本篇随笔介绍在DevExpress ...
前向传播算法(Forward propagation)与反向传播算法(Back propagation)
虽然学深度学习有一段时间了,但是对于一些算法的具体实现还是模糊不清,用了很久也不是很了解.因此特意先对深度学习中的相关基础概念做一下总结.先看看前向传播算法(Forward propagation)与 ...
ex3多类问题和NN中的前向传播
昨日去了趟无锡,前天下了暴雨,所以昨天给我的感觉天气很好,天蓝云白的,以后在这边学习估计也是一件很爽的事情,且昨日通知书业寄到学校了,附赠了一份研究生数学建模的传单,我搜了搜近几年的题目,感觉统计 ...
caffe中的前向传播和反向传播
caffe中的网络结构是一层连着一层的,在相邻的两层中,可以认为前一层的输出就是后一层的输入,可以等效成如下的模型可以认为输出top中的每个元素都是输出bottom中所有元素的函数.如果两个神经元之 ...
从Oracle数据库中查询前几个月数据时需要注意的一些问题
在最近的一个项目中,有一个需求就是要查询数据库中前几个月的历史数据,但是由于自己考虑不全面造成了程序的bug,现在将这一块好好作一个总结,希望以后不再犯这种很低级的错误,首先贴出查询中用到的一个子函数 ...

随机推荐

<s:form action="login"...与<s:form action = "login.action".的区别
1.<s:form action="login" namespace="/login"> 它表示的是<form id="login& ...
C和指针（pointers on C）——第四章：语句（上）
第四章--语句(上) 总结总结!!! C没有布尔类型,所以在一些逻辑推断时候必须用整型表达式,零值为假,非零值为真. for比while把控制循环的表达式收集起来放在一个地方,以便寻找. do语句比w ...
LabVIEW设计模式系列——普遍使用值改变事件
标准: 1.当使用值改变事件时,使用单击时触发或者单击时释放开关动作.这样即保证仅仅触发一次,也保证按钮恢复默认值标准:1.值改变事件的优点:不论是鼠标动作还是键盘动作都能触发值改变事件,增强了程序 ...
C# DataTable怎么合计字段
DataTable dt = new DataTable(); var age=dt.Compute("avg(age)",""); var height =d ...
Linux文件查找命令find用法整理（locate/find）
Linux文件查找查找主要包括:locate和find 1.locate 用法简单,根据数据库查找,非实时,用法: locate FILENAME 手动更新数据库(时间可能较长) updatedb 2 ...
iis5.1/6.0/7.0+ 配置url重写无扩展名伪静态
原文链接:http://www.cnblogs.com/diose/archive/2013/02/21/2920324.html 最近在搞url重写遇到iis 无扩展名及html映射问题供后人查 ...
MVC中HttpContext, HttpContextBase, HttpContextWrapper联系
HttpContext // // 摘要: // 封装有关个别 HTTP 请求的所有 HTTP 特定的信息. public sealed class HttpContext : IServicePro ...
MongoDB的索引
一.索引详讲索引是什么,索引就好比一本书的目录,当我们想找某一章节的时候,通过书籍的目录可以很快的找到,所以适当的加入索引可以提高我们查询的数据的速度. 准备工作,向MongoDB中插入20000条 ...
我和ASP.NET MVC有个约会
很早之前在项目中使用的软件架构模式,一直想着写一写加深自己对它的理解.但总是一天拖着一天,趁着现在闲,跟大家唠唠嗑这个东西. 首先什么是 MVC(Model-View-Controller) 呢?不得 ...
Codeforces 551D GukiZ and Binary Operations(矩阵快速幂)
Problem D. GukiZ and Binary Operations Solution 一位一位考虑,就是求一个二进制序列有连续的1的种类数和没有连续的1的种类数. 没有连续的1的二进制序列的 ...

卷积神经网络 cnnff.m程序 中的前向传播算法 数据 分步解析

卷积神经网络 cnnff.m程序 中的前向传播算法 数据 分步解析的更多相关文章

随机推荐

热门专题

卷积神经网络 cnnff.m程序中的前向传播算法数据分步解析

卷积神经网络 cnnff.m程序中的前向传播算法数据分步解析的更多相关文章