原ppt下载:pan.baidu.com/s/1nv54p9R,密码:3mty

需深入实践并理解的重要概念:

Deep Learning:

  • SoftMax Fuction(输出层归一化函数,与sigmoid相似的激活函数,用于解决分类问题(分类大于2时;sigmoid解决二分类问题))

1)

2)每个neuron的softmax输出:,其中:

DNN(Deep Neural Networks):

  • MSE(Means Square Error,均方误差) / CE(Cross Entropy,交叉熵)

- Use to minimum total costs for softmax layer. CE is better.

- MSE minimum:

- CE minimum:

  • Mini-batch & batch_size(decides how many examples in a mini-batch) & epoch(周期)

- batch:样本训练中,将完整数据分为等量的多个batch(批次),每次输入一个batch而不是完整样本进行训练

- epoch:周期被定义为向前和向后传播中所有batch的单次训练迭代

- mini-batch has better performance than original gradient descent

  • Vanishing Gradient Problem(梯度消失问题)
  • ReLU(Rectified Linear Unit,线性纠正单元)

- As an activative function, used when the number of layers is quite large.

- 对于大于0的所有输入来说,它都有一个不变的导数值;常数导数值有助于网络训练进行得更快,常用于多层隐藏层

- Special cases of MaxOut:

  • Learnable activation function
  • Adaptive learning rate(学习率:每次迭代中cost function中最小化的量。简单来说,我们下降到cost function的最小值的速率是学习率)

- Use a large rate first, then change to a small one

  • Momentum(动量原理)

- Use the optimizer Adam(Advanced Adagrad Momentum)

  • Overfitting Problem(过拟合问题)

- Use early stopping

  • Weight Decay(训练时用p%的dropout,测试时对权值做(1-p%)的调整后再获得输出)
  • Dropout(训练的过程舍弃神经元)

- Will change structure of networks while training. better than MaxOut

CNN(Convolutional Neural Networks):

  • Image recognization suits to use CNN because of 3 important properties:

1) Patterns are much smaller than the whole image

2) The same patterns appear in different regions

3) Subsampling pixels does not change the object

  • filter & channel
  • stride(step)
  • zero-padding
  • max-pooling
  • flattern
  • less parameters because of sharing weights

读《Deep Learning Tutorial》(台湾大学 李宏毅 深度学习教学ppt)后杂记的更多相关文章

  1. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1

    3.Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1 http://blog.csdn.net/sunbow0 ...

  2. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.2

    3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.2 http://blog.csdn.net/sunbow0 ...

  3. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.3

    3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.3 http://blog.csdn.net/sunbow0 ...

  4. Deep Learning 教程(斯坦福深度学习研究团队)

    http://www.zhizihua.com/blog/post/602.html 说明:本教程将阐述无监督特征学习和深度学习的主要观点.通过学习,你也将实现多个功能学习/深度学习算法,能看到它们为 ...

  5. #Deep Learning回顾#之基于深度学习的目标检测(阅读小结)

    原文链接:https://www.52ml.net/20287.html 这篇博文主要讲了深度学习在目标检测中的发展. 博文首先介绍了传统的目标检测算法过程: 传统的目标检测一般使用滑动窗口的框架,主 ...

  6. 【Deep Learning读书笔记】深度学习中的概率论

    本文首发自公众号:RAIS,期待你的关注. 前言 本系列文章为 <Deep Learning> 读书笔记,可以参看原书一起阅读,效果更佳. 概率论 机器学习中,往往需要大量处理不确定量,或 ...

  7. 【deep learning】斯坦福CS231n—深度学习与计算机视觉(资料汇总)

    官网 链接:CS231n: Convolutional Neural Networks for Visual Recognition Notes: 链接:http://cs231n.github.io ...

  8. 深度学习材料:从感知机到深度网络A Deep Learning Tutorial: From Perceptrons to Deep Networks

    In recent years, there’s been a resurgence in the field of Artificial Intelligence. It’s spread beyo ...

  9. Deep Learning Tutorial - Classifying MNIST digits using Logistic Regression

    Deep Learning Tutorial 由 Montreal大学的LISA实验室所作,基于Theano的深度学习材料.Theano是一个python库,使得写深度模型更容易些,也可以在GPU上训 ...

随机推荐

  1. LNMP安装目录及配置文件位置

    LNMP相关软件安装目录 Nginx 目录: /usr/local/nginx/ MySQL 目录 : /usr/local/mysql/MySQL数据库所在目录:/usr/local/mysql/v ...

  2. dijistra

    #include<bits/stdc++.h> using namespace std; ,maxm = ; int begin[maxn],to[maxm],next[maxm],v[m ...

  3. Asp.Net Core配置Swagger

    本文主要参考:Using Swagger with ASP.net Core 1.创建WebApi项目 本文使用ASP.Net Core Web API项目模板演示Swagger到使用,首先创建Web ...

  4. C# IIS站点管理--Microsoft.Web.Administration.dll

    Microsoft中提供了管理IIS7及以上版本一个非常强大的API - Microsoft.Web.Administration.dll,利用该API可以让我们很方便的以编程的方式管理和设定IIS的 ...

  5. JSP随记

    JSP简介: JSP全名为Java Server Pages,中文名叫java服务器页面,其根本是一个简化的Servlet设计,它是由Sun公司倡导.许多公司参与一起建立的一种动态网页技术标准. Se ...

  6. 物化视图(materialized view) 实现数据迁移、数据定时同步

    近日公司有一个9i 的Oracle数据库,运行效率低下.想要将其升级到11G. 但是升级之前 要将数据进行同步,好在表不是很多.只有三张表.业务压力也不大,就想到了使用物 化视图的方式将数据同步过来. ...

  7. net core 接入 Google Authenticator

    一.什么谷歌身份验证器 1.英文名:Authenticator 许网站都需要绑定用以对相关账号进行“二步验证”保护,也叫“双重身份验证”的谷歌身份验证器,以加强安全级别. 2.作用: 这东西就相当于银 ...

  8. jq实现多选反选

    <script type="text/javascript">    $('input [name="ckball"]').click(functi ...

  9. 【UER #8】雪灾与外卖

    题解: 这个东西的模型是个费用流 但是直接跑费用流能拿到5分的高分 $(nm)*(nm)*log{nm}$ 考虑优化一下建图 我们可以不用对每个店和人都连边 而是对人和店都连一条链 然后对每个人连店刚 ...

  10. VIM系统复制粘贴

    1 需求 系统复制粘贴主要是满足下面两个需求. 在多个对象之间复制粘贴 vim窗口与vim窗口之间 外部界面与vim窗口之间 不变复制粘贴.从外部界面复制粘贴到vim窗口时,文本不发生任何变化. 2 ...