SIGAI深度学习第九集卷积神经网络3

讲授卷积神经网络面临的挑战包括梯度消失、退化问题，和改进方法包括卷积层、池化层的改进、激活函数、损失函数、网络结构的改进、残差网络、全卷机网络、多尺度融合、批量归一化等

大纲：

面临的挑战
梯度消失问题
退化问题
改进的总体思路
卷积层的改进
用矩阵乘法实现卷积运算
池化层的改进
激活函数的改进
损失函数的改进
高速公路网络
残差网络
残差网络的分析
全卷积网络
多尺度连接
批量归一化
本集总结

面临的挑战：

卷积神经网络尤其是深度卷积神经网络面临的挑战：

梯度消失问题，全连接神经网络（也叫人工神经网络ANN、多层感知器模型HLP）也提到了，BP传播时要用到f^'(x)，如果f^'(x)<0，会越乘越小，最终梯度趋向于0，那么参数就没法更新了。

退化问题，指网络比较浅的时候，只要样本数量足够多，增加网络层数网络的精度会上升，但是要是网络达到一定层数时再增加层数网络的精度反而会下降。

过拟合问题，深度卷积神经网络一般层数比较多，宽度也比较大，每次神经元和卷积核数量也比较大，这样很容易产生过拟合问题。

计算和存储效率问题，过了追求网络精度，人们把网络做的越来越复杂，深度非常大宽度也很大，网络规模大了之后，不仅算的很慢因为运算的次数会增加，而且很占用存储空间，这样就会限制它的实际的使用。

改进的措施：

卷积层
池化层
激活函数
损失函数
网络结构

梯度消失问题：

深层网络难以训练，主要原因是梯度消失问题
X. Glorot, Y. Bengio. Understanding the difficulty of training deep feedforward neural networks. AISTATS, 2010
在实验中，分别训练了有1到5个隐含层的神经网络，激活函数使用了sigmoid，tanh等
实验结果证明，随着网络层数的增加，反向传播的作用越来越小，网络更加难以训练
激活函数的输入值容易落入饱和区间，导致过拟合

Layer4是第一个隐含层，Layer1是第四个隐含层。

退化问题：

增加网络的层数可以提高网络的精度，但增加到一定程度之后，随着层次的增加，神经网络的训练误差和测
试误差会增大，这个问题称为退化 - 类似维数灾难
退化问题与过拟合不同，过拟合是在测试集上精度差，而退化是在训练集和测试集上精度都下降

改进的总体思路：

改进的目标是网络的精度更高、运行的速度更快。

卷积层
池化层
激活函数
损失函数
网络结构
数据归一化

卷积层的改进：

SIGAI深度学习第九集卷积神经网络3的更多相关文章

SIGAI深度学习第二集人工神经网络1
讲授神经网络的思想起源.神经元原理.神经网络的结构和本质.正向传播算法.链式求导及反向传播算法.神经网络怎么用于实际问题等课程大纲: 神经网络的思想起源神经元的原理神经网络结构正向传播算法怎 ...
SIGAI深度学习第一集机器学习与数学基础知识
SIGAI深度学习课程: 本课程全面.系统.深入的讲解深度学习技术.包括深度学习算法的起源与发展历史,自动编码器,受限玻尔兹曼机,卷积神经网络,循环神经网络,生成对抗网络,深度强化学习,以及各种算法的 ...
【深度学习系列】卷积神经网络CNN原理详解(一)——基本原理
上篇文章我们给出了用paddlepaddle来做手写数字识别的示例,并对网络结构进行到了调整,提高了识别的精度.有的同学表示不是很理解原理,为什么传统的机器学习算法,简单的神经网络(如多层感知机)都可 ...
深度学习笔记 (一) 卷积神经网络基础 (Foundation of Convolutional Neural Networks)
一.卷积卷积神经网络(Convolutional Neural Networks)是一种在空间上共享参数的神经网络.使用数层卷积,而不是数层的矩阵相乘.在图像的处理过程中,每一张图片都可以看成一张“ ...
深度学习项目——基于卷积神经网络（CNN）的人脸在线识别系统
基于卷积神经网络(CNN)的人脸在线识别系统本设计研究人脸识别技术,基于卷积神经网络构建了一套人脸在线检测识别系统,系统将由以下几个部分构成: 制作人脸数据集.CNN神经网络模型训练.人脸检测.人脸 ...
Hinton“深度学习之父”和“神经网络先驱”，新论文Capsule将推翻自己积累了30年的学术成果时
Hinton“深度学习之父”和“神经网络先驱”,新论文Capsule将推翻自己积累了30年的学术成果时在论文中,Capsule被Hinton大神定义为这样一组神经元:其活动向量所表示的是特定实体类型 ...
CNN学习笔记：卷积神经网络
CNN学习笔记:卷积神经网络卷积神经网络基本结构卷积神经网络是一种层次模型,其输入是原始数据,如RGB图像.音频等.卷积神经网络通过卷积(convolution)操作.汇合(pooling)操作 ...
Pytorch_第六篇_深度学习 (DeepLearning) 基础 [2]---神经网络常用的损失函数
深度学习 (DeepLearning) 基础 [2]---神经网络常用的损失函数 Introduce 在上一篇"深度学习 (DeepLearning) 基础 [1]---监督学习和无监督学习 ...
SIGAI深度学习第八集卷积神经网络2
讲授Lenet.Alexnet.VGGNet.GoogLeNet等经典的卷积神经网络.Inception模块.小尺度卷积核.1x1卷积核.使用反卷积实现卷积层可视化等. 大纲: LeNet网络 Ale ...

随机推荐

第6章：LeetCode--数组（冒泡排序、快速排序）
11. Container With Most Water class Solution { public: int maxArea(vector<int>& height) { ...
Python--字典的一些用法dict.items()
1.dict.items() 例子1: 以列表返回可遍历的(键, 值) 元组数组. dict = {'Name': 'Runoob', 'Age': 7} print ("Value : % ...
Mysql 集群环境搭建
在上一篇文章中已经详细的写了关于Mysql的安装步骤.这一篇文章在上一篇文章的基础之上接着写集群的安装与部署. 安装地址:https://www.cnblogs.com/ming-blogs/p/10 ...
（三）自定义Realm
一.Realm概念 Realm:域,Shiro从从Realm获取安全数据(如用户.角色.权限),就是说SecurityManager要验证用户身份,那么它需要从Realm获取相应的用户进行比较以确定用 ...
菜鸡之NetCore 使用EF操作数据库 Oracle & Sqlserver （一）
摘要: 该篇文章主要记录netCore EFCore 如何操作Oracle和SqlServer 数据库,采用Codefirst方式创建数据库以及表. 一, 项目建立项目采用DDD领域驱动设计模式[学 ...
c#基础知识梳理（三）
上期回顾 - https://www.cnblogs.com/liu-jinxin/p/10824638.html 一.方法一个方法是把一些相关的语句组织在一起,用来执行一个任务的语句块.每一个 C ...
redis cluster异地数据迁移，扩容，缩容
由于项目的服务器分布在重庆,上海,台北,休斯顿,所以需要做异地容灾需求.当前的mysql,redis cluster,elastic search都在重庆的如果重庆停电了,整个应用都不能用了. 现在考 ...
Python 遍历文件夹清理磁盘案例
import os suffix_name_list = [".pdb", ".ilk"] def find_file(path): # 遍历文件夹 for i ...
KVM之virsh管理虚拟机硬盘配置
新建raw格式虚拟盘 [root@ubuntu ~]# qemu-img create -f raw /data/raw/disk02.raw 5G Formatting '/data/raw/dis ...
Java面试容器，collection，list，set
1.容器指的是可以容纳其他对象的对象. 2.collection/set/list的联系和区别? (1)collection是Java集合顶级接口,存储一组不唯一,无序的对象: (2)list接口 ...

SIGAI深度学习第九集 卷积神经网络3

SIGAI深度学习第九集 卷积神经网络3的更多相关文章

随机推荐

热门专题

SIGAI深度学习第九集卷积神经网络3

SIGAI深度学习第九集卷积神经网络3的更多相关文章