CNN卷积层基础：特征提取+卷积核+反向传播

AYE89 2024-10-15 01:05:50 原文

本篇介绍卷积层的线性部分

一、与全连接层相比卷积层有什么优势？

卷积层可以节省参数，因为卷积运算利用了图像的局部相关性——分析出一小片区域的特点，加上Pooling层（汇集、汇聚），从附近的卷积结果中再采样选择一些高价值的信息，让特征向少而精的方向前进。

全连接层相当于考虑全局（整张图像）的特征

二、卷积的另一种解释

傅里叶变换：将数据从空间域的展示形式转变到频率域的形式。

理解：图像比作一道做好的菜，傅里叶变换就是找出这道菜具体的配料及各种配料的用量。

图像中，低频信息是大体轮廓（整体），高频信息是图中物体的纹理特征

若A, B是矩阵，下面两式是等价的

C=conv2（A, B）

C=IFFT(FFT(A) * FFT(B)) #这里*是“元素级别的乘法”

对卷积核做傅里叶变换，可以看出高/低频信号的强度，

由于最终要进行元素级的乘法，如果卷积核在某个频率的数值比较低，经过乘法后的输入数据在这个频率的数据也会变小。滤波核在某个频率的数值为0，说明卷积算法计算后会舍弃这部分信息。

Gabor Filter，保留高频舍弃低频，一些文章宣称自己的模型第一层的参数像Gabor Filter。

所以，从傅里叶变换来看，卷积层的意义——

分离低频和高频信息，使它们能够被分别处理。

三、卷积层的反向传播

计算参数：

1卷积层输入图像（数据）X对目标函数的偏导数

2卷积层线性部分参数W对目标函数的偏导数

解法

A：按卷积定义求解，需要计算：

1前向计算图

2下层Loss

3本层w导数

B：转换后的解法，软件库中常用套路

将卷积运算转换为矩阵和向量的点积——

输入数据被转换成了一个size更大的矩阵（为了适应矩阵式的卷积操作有些元素需要重复出现）

卷积核被转换成了一个向量

软件库选择矩阵式解法的原因：矩阵乘法运算经过多年的研究，运算效率非常有保障。按定义的卷积运算性能较差。

CNN卷积层基础：特征提取+卷积核+反向传播的更多相关文章

CNN卷积层：ReLU函数
卷积层的非线性部分一.ReLU定义 ReLU:全称 Rectified Linear Units)激活函数定义 def relu(x): return x if x >0 else 0 #S ...
Deep Learning基础--随时间反向传播（BackPropagation Through Time，BPTT）推导
1. 随时间反向传播BPTT(BackPropagation Through Time, BPTT) RNN(循环神经网络)是一种具有长时记忆能力的神经网络模型,被广泛用于序列标注问题.一个典型的RN ...
Tensorflow之CNN卷积层池化层padding规则
padding的规则 · padding=‘VALID’时,输出的宽度和高度的计算公式(下图gif为例) 输出宽度:output_width = (in_width-filter_wid ...
CNN 卷积层输入Map大小计算
对于输出的size计算: out_height=((input_height - filter_height + padding_top+padding_bottom)/stride_height ) ...
CNN中卷积层池化层反向传播
参考:https://blog.csdn.net/kyang624823/article/details/78633897 卷积层池化层反向传播: 1,CNN的前向传播 a)对于卷积层,卷积核与输入 ...
卷积神经网络(CNN)反向传播算法
在卷积神经网络(CNN)前向传播算法中,我们对CNN的前向传播算法做了总结,基于CNN前向传播算法的基础,我们下面就对CNN的反向传播算法做一个总结.在阅读本文前,建议先研究DNN的反向传播算法:深度 ...
2. CNN卷积网络-前向传播算法
1. CNN卷积网络-初识 2. CNN卷积网络-前向传播算法 3. CNN卷积网络-反向更新 1. 前言我们已经了解了CNN的结构,CNN主要结构有输入层,一些卷积层和池化层,后面是DNN全连接层 ...
卷积神经网络基础（CNN）【转载】
作者: Sanjay Chan [ http://blog.csdn.net/chenzomi ] 背景之前在网上搜索了好多好多关于CNN的文章,由于网络上的文章很多断章取义或者描述不清晰,看了很多 ...
CNN中卷积层的计算细节
原文链接: https://zhuanlan.zhihu.com/p/29119239 卷积层尺寸的计算原理输入矩阵格式:四个维度,依次为:样本数.图像高度.图像宽度.图像通道数输出矩阵格式:与输 ...

随机推荐

Embedded SW uses STL or not
As the complexity increasing of embedded software, more and more projects/products use C++ as the im ...
CloudStack学习-3
此次试验主要是CloudStack结合openvswitch 背景介绍之所以引入openswitch,是因为如果按照之前的方式,一个网桥占用一个vlan,假如一个zone有20个vlan,那么岂不是 ...
JDK8中的时间API
在Java 1.0中,对日期和时间的支持只能依赖java.util.Date类.正如类名所表达的,这个类无法表示日期,只能以毫秒的精度表示时间.更糟糕的是它的易用性,由于某些原因未知的设计决策,这个类 ...
mobx 知识点
antd+mobx 项目例子:https://github.com/cag2050/antd_mobx_demo 在 create-react-app 创建的项目中,使用 mobx:https://s ...
TP5一对一、一对多关联模型的使用
文章表SQL CREATE TABLE `tp_article` ( `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键ID', `title` varc ...
代码问题: 【ADNet】
[ADNet]: Yoo S, Yun K, Choi J Y. Action-Decision Networks for Visual Tracking with Deep Reinforcemen ...
修改 spawn node.exe" ENOENT at notFoundError问题
Ionic server启动后,出现spawn node.exe" ENOENT at notFoundError ...\node_modules\cross-spawn\lib\enoe ...
mysql程序之mysqld_safe详解
mysqld_safe命令 mysqld_safe是在Unix上启动mysqld服务器的推荐方法.mysqld_safe增加了一些安全特性,例如在发生错误时重新启动服务器,并将运行时信息记录到错误日志 ...
RSA读取密钥——使用openssl编程
RSA是基于数论中大素数的乘积难分解理论上的非对称加密法.在此密码术中,使用公钥(public key)和私钥(private key)两个不同的密钥:公钥用于加密,它是向所有人公开的:私钥用于解密, ...
linux 服务器之间配置免密登录
客户机:172.16.1.2 远程机:172.16.1.3 1.远程机 a.允许root用户通过22端口登录 vi /etc/ssh/sshd_config PORT 22 PermitRootLog ...