深度学习与传统机器学习的区别

传统机器学习输入的特征为人工提取的特征,例如人的身高、体重等,深度学习则不然,它接收的是基础特征,例如图片像素等,通过多层复杂特征提取获得。

深度学习、人工智能、机器学习的关系

人工智能是一个非常广泛的问题,机器学习是人工智能的一种手段,深度学习是机器学习的一个分支
人工智能>机器学习>深度学习

深度学习两个重要特征

多层和非线性(激活函数)

WordNet

是开放环境中的一个较大且有影响力的知识图库,它将15W单词整理成11W个近义词集。并定义了近义词集之间的关系。

Wikipedia

谷歌的知识图库就是基于Wikipedia创建的。

perceptron模型的局限性

  1. 只能解决线性可分问题
  2. 无法解决异或问题
    这些问题通过多层网络解决

反向传播算法的意义

大幅降低了训练需要的时间

LSTM(long short-term memory)应用场景

NLP,机器翻译,语音识别,时序预测

90年代末SVM超越NN的原因

计算资源+数据量无法满足深沉神经网络

神经网络权重参数weight的下标

前者为上一层神经单元的个数,后者为下一层神经单元的个数

损失函数——交叉熵

适用:分类问题
\begin{equation}
H(p,q) = - \sum_{x} p(x) * \log{q(x)}
\end{equation}
p和q都是概率分布,交叉熵刻画的是p,q两个概率概率分布之间的距离,也就是q表达p的困难程度,交叉熵越小,困难程度越小,q与p的距离越接近。
这里的x,可以理解为,对于某条记录而言,预测值的各种可能结果。H(p,q)相当于对于一条记录而言,预测值与真实值的距离。预测值与真实值不一定是二分类也可能是多分类

softmax回归

将神经网络的输出向量y(one-hot向量),经过公式(2)转化为概率分布(向量),用于计算交叉熵。
设原始输出单元为\(y_1\),\(y_2\),...\(y_n\),
\begin{equation}
softmax(y_i) =\frac{e^{y_i}}{\sum_{j=1}^{n} e^{y_j}}
\end{equation}

损失函数——MSE(mean squared error)均方误差

适用:单输出节点的回归问题(也是分类问题中常用的一种损失函数)
\begin{equation}
MSE(y,y^{'})=\frac{\sum_{i=1}^n (y_i-y_i^{'})^2}{n}
\end{equation}
TensorFlow中一般的实现方式:mse = tf.reduce_mean(tf.square(y_ - y))

TensorFlow——深度学习笔记的更多相关文章

  1. Google TensorFlow深度学习笔记

    Google Deep Learning Notes Google 深度学习笔记 由于谷歌机器学习教程更新太慢,所以一边学习Deep Learning教程,经常总结是个好习惯,笔记目录奉上. Gith ...

  2. TensorFlow 深度学习笔记 卷积神经网络

    Convolutional Networks 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Is ...

  3. TensorFlow 深度学习笔记 TensorFlow实现与优化深度神经网络

    转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论 官方教程地址 视频/字幕下载 全 ...

  4. TensorFlow深度学习笔记 循环神经网络实践

    转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论 官方教程地址 视频/字幕下载 加 ...

  5. TensorFlow 深度学习笔记 逻辑回归 实践篇

    Practical Aspects of Learning 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有 ...

  6. TensorFlow深度学习笔记 Tensorboard入门

    转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论 官方教程: https://ww ...

  7. TensorFlow 深度学习笔记 从线性分类器到深度神经网络

    转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论 官方教程地址 视频/字幕下载 L ...

  8. TensorFlow深度学习笔记 文本与序列的深度模型

    Deep Models for Text and Sequence 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎st ...

  9. TensorFlow 深度学习笔记 Stochastic Optimization

    Stochastic Optimization 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到I ...

随机推荐

  1. 第21章 DMA—直接存储区访问—零死角玩转STM32-F429系列

    第21章     DMA—直接存储区访问 全套200集视频教程和1000页PDF教程请到秉火论坛下载:www.firebbs.cn 野火视频教程优酷观看网址:http://i.youku.com/fi ...

  2. mybatis-generator的maven插件使用异常(mybatis-generator-maven-plugin):generate failed: Exception getting JDBC Driver

    使用mybatis的代码生成工具:mybatis-generator,在父model中引入了maven插件的依赖,如下: <!-- Mybatis.generator插件 --> < ...

  3. Angular之简单的登录注册

    使用Angular实现了一个简单的登录注册的功能........ 涉及到的Angular知识点很少 主要是这个功能的实现...(*^__^*) 嘻嘻…… 里面涉及到的知识点记录: 1.本地存储的操作 ...

  4. 牛客小白月赛2 A 数字方阵【随机】【找规律】

    链接:https://www.nowcoder.com/acm/contest/86/A 题目描述  总是对数字的神秘感感到好奇.这次,他在纸上写下了  个从 到 的数字,并把这些数字排成了 的方阵. ...

  5. Java - 静态方法的线程安全问题

    若该静态方法中有对某个静态属性操作,那么它就不是线程安全的,反之,若只对实例属性操作,那么它就是线程安全的.     补充说明,因为,静态方法不对特定的实例操作,只能访问静态成员.实例方法可对特定的实 ...

  6. python核心编程2 第五章 练习

    5-2 运算符(a) 写一个函数,计算并返回两个数的乘积(b) 写一段代码调用这个函数,并显示它的结果 def product(x, y): return x * y if __name__ == ' ...

  7. linux常见内核参数

    参数 描述 net.ipv4.ip_forward 接口间转发报文net.ipv4.tcp_tw_reuse 表示是否允许将处于 TIME-WAIT 状态的 socket (TIME-WAIT 的端口 ...

  8. MUI常用脚本及原生JavaScript常用操作元素方法

    1.mui元素转换html元素 var obj=mui("#id")[0]; 2.事件绑定 var btn = document.getElementById("logi ...

  9. PHP脚本执行效率性能检测之WebGrind的使用

    webgrind这个性能检测是需要xdebug来配合,因为webgrind 进行性能检测分析就是通过xdebug生成的日志文件进行编译分析的 那么这就需要们配置好xdebug,这个一般的php 版本都 ...

  10. linux系统集群之高可用(一)HA

    HA(High aviliable)高可用 高可用的需求 在很多公司里面,都会存在着一些不愿被中断的业务,但是由于硬件故障,软件故障,人为因素等各种因素,往往会不经意的造成我们重要的业务中断,因此高可 ...