【dlbook】深度网络

前向网络：无反馈 feedback 连接

【输出单元】

　　线性 -- 高斯分布、

　　sigmoid单元 -- bernoulli输出、

　　softmax单元 -- multinoulli

【隐藏单元】

整流线型单元： relu，不可微，但是在梯度下降中的表现依然很好。原因是只要接近局部最小值即可，不需要达到。

　　优势：二阶导数几乎处处为0，也就是梯度更加有用！

　　缺陷：如果为0，那么就不能基于梯度的方法学习，因此需要拓展。

　　拓展：在小于0时使用一个非零的斜率：

　　　　　　绝对值整流：固定为1

　　　　　　渗透整流： Leaky ReLU 固定为一个类似0.01的小值

　　　　　　参数化整流：将其作为一个参数进行学习。2015年的paper.

sigmoid与tanh

　　广泛饱和性：z很大饱和到高值，z很小饱和到低值，z接近0才比较敏感。如果加入weight decay会比较好。

　　tanh通常比sigmoid要好：在0附近，tanh和单位函数比较像，因此只要不饱和，训练tanh更加容易。

线性隐藏单元：

　　单位函数作为激活函数，如果n到p的网络线性相关，秩为q，那么可以用一个q个节点的线性层来实现，可以有效的减少网络的参数。

其他隐藏单元：

　　径向基函数：x在某个值表现更活跃，

　　softplus：平滑版的ReLU，但是通常表现并没有ReLU好，比较反直觉

　　硬双曲正切：max(-1, min(1, a))，

【架构设计】

万能近似定理：只要一层就能以任意精度近似有限维Borel可测函数

学习失败的原因：

　　优化算法找不到最优，

　　过拟合

有一些临界值d，在大于d时能高效的近似，但是小于d时需要一个远远更大的模型。

对ReLU来说，一个深度网络可能需要指数级的浅层网络的参数

对于一个卷积的例子，增加网络参数但是不增加层数，事实证明是没有什么用的。

【历史总结】

神经网络在很小的时候 sigmoid显著比ReLU更好，

对于小的数据集，线性整流甚至比学习隐层权重更重要。

【dlbook】深度网络的更多相关文章

Deep Learning 学习随记（五）深度网络--续
前面记到了深度网络这一章.当时觉得练习应该挺简单的,用不了多少时间,结果训练时间真够长的...途中debug的时候还手贱的clear了一下,又得从头开始运行.不过最终还是调试成功了,sigh~ 前一篇 ...
Deep Learning 学习随记（五）Deep network 深度网络
这一个多周忙别的事去了,忙完了,接着看讲义~ 这章讲的是深度网络(Deep Network).前面讲了自学习网络,通过稀疏自编码和一个logistic回归或者softmax回归连接,显然是3层的.而这 ...
Local Binary Convolutional Neural Networks ---卷积深度网络移植到嵌入式设备上？
前言:今天他给大家带来一篇发表在CVPR 2017上的文章. 原文:LBCNN 原文代码:https://github.com/juefeix/lbcnn.torch 本文主要内容:把局部二值与卷积神 ...
Paper | 深度网络中特征的可迁移性
目录 1. 核心贡献 2. 实验设置 2.1. 任务设置 2.2. 网络设置 3. 实验结果 4. 启发论文:How transferable are features in deep neural ...
UFLDL深度学习笔记（四）用于分类的深度网络
UFLDL深度学习笔记 (四)用于分类的深度网络 1. 主要思路本文要讨论的"UFLDL 建立分类用深度网络"基本原理基于前2节的softmax回归和无监督特征学习,区别在于使 ...
基于深度学习和迁移学习的识花实践——利用 VGG16 的深度网络结构中的五轮卷积网络层和池化层，对每张图片得到一个 4096 维的特征向量，然后我们直接用这个特征向量替代原来的图片，再加若干层全连接的神经网络，对花朵数据集进行训练（属于模型迁移）
基于深度学习和迁移学习的识花实践(转) 深度学习是人工智能领域近年来最火热的话题之一,但是对于个人来说,以往想要玩转深度学习除了要具备高超的编程技巧,还需要有海量的数据和强劲的硬件.不过 Tens ...
Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks(用于深度网络快速适应的元学习)
摘要:我们提出了一种不依赖模型的元学习算法,它与任何梯度下降训练的模型兼容,适用于各种不同的学习问题,包括分类.回归和强化学习.元学习的目标是在各种学习任务上训练一个模型,这样它只需要少量的训练样本就 ...
旷视等Oral论文提出GeoNet：基于测地距离的点云分析深度网络
基于网格曲面的几何拓扑信息可以为物体语义分析和几何建模提供较强的线索,但是,如此重要的连接性信息在点云中是缺失的.为此,旷视西雅图研究院首次提出一种全新的深度学习网络,称之为 GeoNet,可建模点云 ...
深度网络中的Tricks
数据增强(Data augmentation) 预处理(Pre-processing) 初始化(Initializations) 训练中的Tricks 激活函数(Activation function ...

随机推荐

Tornado介绍与其Web应用结构
1.介绍 tornado是一个Python web框架和异步网络库起初由 FriendFeed 开发. 通过使用非阻塞网络I/O, Tornado 可以支持上万级的连接,处理长连接, WebSoc ...
if 条件判断
逻辑判断的布尔值(true&false) 1.逻辑值(bool)用来表示诸如:对与错,真与假,非于空等概念. 2.逻辑值包含了两个值:--true:表示非空的量(比如:string,tuple ...
iOS学习之七牛云存储应用
前言七牛云存储,是专为移动时代开发者打造的数据管理平台,为互联网网站和移动App提供数据的在线托管.传输加速以及图片.音视频等富媒体的云处理服务. 七牛云官网http://www.qiniu.com ...
delphi 改变闪动光标
delphi 改变闪动光标 // 不同风格的光标 procedure TForm1.Edit1MouseDown(Sender: TObject; Button: TMouseButton;Shift ...
Xamrin开发安卓笔记（三）
http://www.cnblogs.com/minCS/p/4118170.html Xamrin开发安卓笔记(三) 安装片 Xamrin开发安卓笔记(一) Xamrin开发安卓笔记(二) 这次 ...
JavaScript：确认对话框
<script type="text/javascript"> function Check() { if (window.confirm('您是否参与抽奖?')) { ...
笔记-mysql 导出查询结果
语法: The SELECT ... INTO OUTFILE 'file_name' [options] form of SELECT writes the selected rows to a f ...
Javascript中call()和apply()的用法 ----1
1.方法定义 call方法: 语法:call([thisObj[,arg1[, arg2[, [,.argN]]]]]) 定义:调用一个对象的一个方法,以另一个对象替换当前对象. 说明: call ...
hadoop27---netty中handler的执行顺序
Netty是基于Java NIO的网络应用框架. Netty是一个NIO client-server(客户端服务器)框架,使用Netty可以快速开发网络应用,例如服务器和客户端协议.Netty提供了一 ...
【笔记】c++文件
1.文件. #include <iostream> #include <cstdio> #include <string> #include <cstring ...

【dlbook】深度网络

【dlbook】深度网络的更多相关文章

随机推荐

热门专题