TensorFlow——深度学习笔记
深度学习与传统机器学习的区别
传统机器学习输入的特征为人工提取的特征,例如人的身高、体重等,深度学习则不然,它接收的是基础特征,例如图片像素等,通过多层复杂特征提取获得。
深度学习、人工智能、机器学习的关系
人工智能是一个非常广泛的问题,机器学习是人工智能的一种手段,深度学习是机器学习的一个分支
人工智能>机器学习>深度学习
深度学习两个重要特征
多层和非线性(激活函数)
WordNet
是开放环境中的一个较大且有影响力的知识图库,它将15W单词整理成11W个近义词集。并定义了近义词集之间的关系。
Wikipedia
谷歌的知识图库就是基于Wikipedia创建的。
perceptron模型的局限性
- 只能解决线性可分问题
- 无法解决异或问题
这些问题通过多层网络解决
反向传播算法的意义
大幅降低了训练需要的时间
LSTM(long short-term memory)应用场景
NLP,机器翻译,语音识别,时序预测
90年代末SVM超越NN的原因
计算资源+数据量无法满足深沉神经网络
神经网络权重参数weight的下标
前者为上一层神经单元的个数,后者为下一层神经单元的个数
损失函数——交叉熵
适用:分类问题
\begin{equation}
H(p,q) = - \sum_{x} p(x) * \log{q(x)}
\end{equation}
p和q都是概率分布,交叉熵刻画的是p,q两个概率概率分布之间的距离,也就是q表达p的困难程度,交叉熵越小,困难程度越小,q与p的距离越接近。
这里的x,可以理解为,对于某条记录而言,预测值的各种可能结果。H(p,q)相当于对于一条记录而言,预测值与真实值的距离。预测值与真实值不一定是二分类也可能是多分类
softmax回归
将神经网络的输出向量y(one-hot向量),经过公式(2)转化为概率分布(向量),用于计算交叉熵。
设原始输出单元为\(y_1\),\(y_2\),...\(y_n\),
\begin{equation}
softmax(y_i) =\frac{e^{y_i}}{\sum_{j=1}^{n} e^{y_j}}
\end{equation}
损失函数——MSE(mean squared error)均方误差
适用:单输出节点的回归问题(也是分类问题中常用的一种损失函数)
\begin{equation}
MSE(y,y^{'})=\frac{\sum_{i=1}^n (y_i-y_i^{'})^2}{n}
\end{equation}
TensorFlow中一般的实现方式:mse = tf.reduce_mean(tf.square(y_ - y))
TensorFlow——深度学习笔记的更多相关文章
- Google TensorFlow深度学习笔记
Google Deep Learning Notes Google 深度学习笔记 由于谷歌机器学习教程更新太慢,所以一边学习Deep Learning教程,经常总结是个好习惯,笔记目录奉上. Gith ...
- TensorFlow 深度学习笔记 卷积神经网络
Convolutional Networks 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Is ...
- TensorFlow 深度学习笔记 TensorFlow实现与优化深度神经网络
转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论 官方教程地址 视频/字幕下载 全 ...
- TensorFlow深度学习笔记 循环神经网络实践
转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论 官方教程地址 视频/字幕下载 加 ...
- TensorFlow 深度学习笔记 逻辑回归 实践篇
Practical Aspects of Learning 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有 ...
- TensorFlow深度学习笔记 Tensorboard入门
转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论 官方教程: https://ww ...
- TensorFlow 深度学习笔记 从线性分类器到深度神经网络
转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论 官方教程地址 视频/字幕下载 L ...
- TensorFlow深度学习笔记 文本与序列的深度模型
Deep Models for Text and Sequence 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎st ...
- TensorFlow 深度学习笔记 Stochastic Optimization
Stochastic Optimization 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到I ...
随机推荐
- Centos6.4环境下DNS服务器的搭建
DNS服务器搭建很繁琐吗?给你个简单的招吧! 配置域主服务器 阶段: 1.在bind的主配置文件中添加该域 2.在/var/named中创建该域的zone文件 3.编辑zone文件,添加需要的信息 4 ...
- C语言中%p,%u,%lu都有什么用处
%p表示输出这个指针, %d表示后面的输出类型为有符号的10进制整形, %u表示无符号10进制整型, %lu表示输出无符号长整型整数 (long unsigned)
- vue 中$index $key 已经移除了
https://cn.vuejs.org/v2/guide/migration.html#index-and-key-移除 之前可以这样: 1 2 3 4 5 6 <ul id="ex ...
- python 添加 threadpool
操作系统: Ubuntu 10.04 python安装依赖的软件包: python 出现 ImportError: No module named ** 我这里出现了: ImportError: No ...
- maven解析xml+测试test+注解
条件:maven项目 测试图: 创建maven项目,在maven项目中scr目录下有main.test(没有就创建) 一.解析XML文件方式 在main目录下有java.resources.webap ...
- javaweb基础(35)_jdbc处理oracl大数据
一.Oracle中大数据处理 在Oracle中,LOB(Large Object,大型对象)类型的字段现在用得越来越多了.因为这种类型的字段,容量大(最多能容纳4GB的数据),且一个表中可以有多个这种 ...
- 第17章 EXTI—外部中断/事件控制器—零死角玩转STM32-F429系列
第17章 EXTI—外部中断/事件控制器 全套200集视频教程和1000页PDF教程请到秉火论坛下载:www.firebbs.cn 野火视频教程优酷观看网址:http://i.youku.co ...
- 微信小程序开发踩坑与总结 -
原文链接:https://segmentfault.com/a/1190000008516296 前段时间把公司小程序项目开发完成了,所以来写写自己开发过程中碰到的问题和解决方法,以及用到的提高效率的 ...
- using namespace std 是什么意思?
摘录CSDN上面大牛的回答简要意思就是使用标准库,想知道更清楚的继续读下面的. using namespace std 意思: using 和namespace都是C++的关键词. ...
- Linux添加swap分区
swap分区的作用为当系统的物理内存不够用的时候,就需要将物理内存中的一部分空间释放出来,以供当前运行的程序使用,那些被释放的空间可能来自一些很长时间没有什么操作的程序,这些被释放的空间被临时保存到S ...