原ppt下载:pan.baidu.com/s/1nv54p9R,密码:3mty

需深入实践并理解的重要概念:

Deep Learning:

  • SoftMax Fuction(输出层归一化函数,与sigmoid相似的激活函数,用于解决分类问题(分类大于2时;sigmoid解决二分类问题))

1)

2)每个neuron的softmax输出:,其中:

DNN(Deep Neural Networks):

  • MSE(Means Square Error,均方误差) / CE(Cross Entropy,交叉熵)

- Use to minimum total costs for softmax layer. CE is better.

- MSE minimum:

- CE minimum:

  • Mini-batch & batch_size(decides how many examples in a mini-batch) & epoch(周期)

- batch:样本训练中,将完整数据分为等量的多个batch(批次),每次输入一个batch而不是完整样本进行训练

- epoch:周期被定义为向前和向后传播中所有batch的单次训练迭代

- mini-batch has better performance than original gradient descent

  • Vanishing Gradient Problem(梯度消失问题)
  • ReLU(Rectified Linear Unit,线性纠正单元)

- As an activative function, used when the number of layers is quite large.

- 对于大于0的所有输入来说,它都有一个不变的导数值;常数导数值有助于网络训练进行得更快,常用于多层隐藏层

- Special cases of MaxOut:

  • Learnable activation function
  • Adaptive learning rate(学习率:每次迭代中cost function中最小化的量。简单来说,我们下降到cost function的最小值的速率是学习率)

- Use a large rate first, then change to a small one

  • Momentum(动量原理)

- Use the optimizer Adam(Advanced Adagrad Momentum)

  • Overfitting Problem(过拟合问题)

- Use early stopping

  • Weight Decay(训练时用p%的dropout,测试时对权值做(1-p%)的调整后再获得输出)
  • Dropout(训练的过程舍弃神经元)

- Will change structure of networks while training. better than MaxOut

CNN(Convolutional Neural Networks):

  • Image recognization suits to use CNN because of 3 important properties:

1) Patterns are much smaller than the whole image

2) The same patterns appear in different regions

3) Subsampling pixels does not change the object

  • filter & channel
  • stride(step)
  • zero-padding
  • max-pooling
  • flattern
  • less parameters because of sharing weights

读《Deep Learning Tutorial》(台湾大学 李宏毅 深度学习教学ppt)后杂记的更多相关文章

  1. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1

    3.Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1 http://blog.csdn.net/sunbow0 ...

  2. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.2

    3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.2 http://blog.csdn.net/sunbow0 ...

  3. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.3

    3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.3 http://blog.csdn.net/sunbow0 ...

  4. Deep Learning 教程(斯坦福深度学习研究团队)

    http://www.zhizihua.com/blog/post/602.html 说明:本教程将阐述无监督特征学习和深度学习的主要观点.通过学习,你也将实现多个功能学习/深度学习算法,能看到它们为 ...

  5. #Deep Learning回顾#之基于深度学习的目标检测(阅读小结)

    原文链接:https://www.52ml.net/20287.html 这篇博文主要讲了深度学习在目标检测中的发展. 博文首先介绍了传统的目标检测算法过程: 传统的目标检测一般使用滑动窗口的框架,主 ...

  6. 【Deep Learning读书笔记】深度学习中的概率论

    本文首发自公众号:RAIS,期待你的关注. 前言 本系列文章为 <Deep Learning> 读书笔记,可以参看原书一起阅读,效果更佳. 概率论 机器学习中,往往需要大量处理不确定量,或 ...

  7. 【deep learning】斯坦福CS231n—深度学习与计算机视觉(资料汇总)

    官网 链接:CS231n: Convolutional Neural Networks for Visual Recognition Notes: 链接:http://cs231n.github.io ...

  8. 深度学习材料:从感知机到深度网络A Deep Learning Tutorial: From Perceptrons to Deep Networks

    In recent years, there’s been a resurgence in the field of Artificial Intelligence. It’s spread beyo ...

  9. Deep Learning Tutorial - Classifying MNIST digits using Logistic Regression

    Deep Learning Tutorial 由 Montreal大学的LISA实验室所作,基于Theano的深度学习材料.Theano是一个python库,使得写深度模型更容易些,也可以在GPU上训 ...

随机推荐

  1. GrayLog + Logspout + Docker 实现分布式日志聚合

    前提条件:你的服务器上已经安装了Docker和Docker Compose 一.安装GrayLog(Docker方式) version: '2' services: mongodb: image: m ...

  2. Xshell 连接虚拟机出现 "The remote SSH server rejected X11 forwarding request"

    1. 描述 虚拟机:VirtualBox Linux: centOS7 解决了 centOS7在VirtualBox中装好后的网络连接问题 后,用 Xshell 连接服务器时出现下面情况: 2. ss ...

  3. SQLAlchemy+Flask-RESTful使用(三)

    前言 顺理成章地,19.3.21起笔了第三章.也就是最近没啥事了,才有时间搞这些.生命不息奋斗不止吧! 变更记录 # 19.3.21 起笔 # 19.3.21 增加 Flask-RESTful如何获取 ...

  4. 一篇文章搞懂Android组件化

    网上组件化的文章很多,我本人学习组建化的过程也借鉴了网上先辈们的文章.但大多数文章都从底层的细枝末节开始讲述,由下而上给人一种这门技术“博大精深”望而生畏的感觉.而我写这篇文章的初衷就是由上而下,希望 ...

  5. BFC知识点概括与总结

    什么是BFC?如何生成一个BFC?BFC有什么作用? 一:什么是BFC? 首先了解CSS中两个概念:box和formatting context. Box:CSS布局中的基本单位.一个页面由多个box ...

  6. C#应用编程小例子-01-渐显的窗体

    C#应用编程小例子-01-渐显的窗体 using System; using System.Windows.Forms; namespace WindowsFormsApp2 { public par ...

  7. [转]Example Design - Using the AXI DMA in polled mode to transfer data to memory

    Description Attached to this Answer Record is an Example Design for using the AXI DMA in polled mode ...

  8. Oracle 正则表达式 分割字符串

    inData='12345|张三|男' SELECT REGEXP_SUBSTR (inData, '[^|]+', 1,1) into 用户ID FROM DUAL;SELECT REGEXP_SU ...

  9. SpringMVC是怎么工作的,SpringMVC的工作原理

    SpringWeb MVC 是怎么工作的,SpringMVC的原理,SpringMVC源码 分析. 介绍 SpringWeb MVC是Spring Framework中的一部分,当我们需要使用spri ...

  10. 【转】Android开发规范

    转自:https://github.com/Blankj/AndroidStandardDevelop 摘要 1 前言 2 AS 规范 3 命名规范 4 代码样式规范 5 资源文件规范 6 版本统一规 ...