TensorFlow——深度学习笔记

DianeSoHungry 2024-08-31 07:25:36 原文

深度学习与传统机器学习的区别

传统机器学习输入的特征为人工提取的特征，例如人的身高、体重等，深度学习则不然，它接收的是基础特征，例如图片像素等，通过多层复杂特征提取获得。

深度学习、人工智能、机器学习的关系

人工智能是一个非常广泛的问题，机器学习是人工智能的一种手段，深度学习是机器学习的一个分支
人工智能>机器学习>深度学习

深度学习两个重要特征

多层和非线性（激活函数）

WordNet

是开放环境中的一个较大且有影响力的知识图库，它将15W单词整理成11W个近义词集。并定义了近义词集之间的关系。

Wikipedia

谷歌的知识图库就是基于Wikipedia创建的。

perceptron模型的局限性

只能解决线性可分问题
无法解决异或问题
这些问题通过多层网络解决

反向传播算法的意义

大幅降低了训练需要的时间

LSTM(long short-term memory)应用场景

NLP，机器翻译，语音识别，时序预测

90年代末SVM超越NN的原因

计算资源+数据量无法满足深沉神经网络

神经网络权重参数weight的下标

前者为上一层神经单元的个数，后者为下一层神经单元的个数

损失函数——交叉熵

适用：分类问题
\begin{equation}
H(p,q) = - \sum_{x} p(x) * \log{q(x)}
\end{equation}
p和q都是概率分布，交叉熵刻画的是p,q两个概率概率分布之间的距离，也就是q表达p的困难程度，交叉熵越小，困难程度越小，q与p的距离越接近。
这里的x，可以理解为，对于某条记录而言，预测值的各种可能结果。H(p,q)相当于对于一条记录而言，预测值与真实值的距离。预测值与真实值不一定是二分类也可能是多分类

softmax回归

将神经网络的输出向量y(one-hot向量)，经过公式（2）转化为概率分布（向量），用于计算交叉熵。
设原始输出单元为\(y_1\),\(y_2\),...\(y_n\),
\begin{equation}
softmax(y_i) =\frac{e^{y_i}}{\sum_{j=1}^{n} e^{y_j}}
\end{equation}

损失函数——MSE(mean squared error)均方误差

适用：单输出节点的回归问题(也是分类问题中常用的一种损失函数)
\begin{equation}
MSE(y,y^{'})=\frac{\sum_{i=1}^n (y_i-y_i^{'})^2}{n}
\end{equation}
TensorFlow中一般的实现方式：mse = tf.reduce_mean(tf.square(y_ - y))

TensorFlow——深度学习笔记的更多相关文章

Google TensorFlow深度学习笔记
Google Deep Learning Notes Google 深度学习笔记由于谷歌机器学习教程更新太慢,所以一边学习Deep Learning教程,经常总结是个好习惯,笔记目录奉上. Gith ...
TensorFlow 深度学习笔记卷积神经网络
Convolutional Networks 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Is ...
TensorFlow 深度学习笔记 TensorFlow实现与优化深度神经网络
转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论官方教程地址视频/字幕下载全 ...
TensorFlow深度学习笔记循环神经网络实践
转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论官方教程地址视频/字幕下载加 ...
TensorFlow 深度学习笔记逻辑回归实践篇
Practical Aspects of Learning 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有 ...
TensorFlow深度学习笔记 Tensorboard入门
转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论官方教程: https://ww ...
TensorFlow 深度学习笔记从线性分类器到深度神经网络
转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论官方教程地址视频/字幕下载 L ...
TensorFlow深度学习笔记文本与序列的深度模型
Deep Models for Text and Sequence 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎st ...
TensorFlow 深度学习笔记 Stochastic Optimization
Stochastic Optimization 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到I ...

随机推荐

JS显示上一周
<html> <head> <script> var currDT; var aryDay = new Array("日","一&qu ...
python遇到IndentationError: unexpected indent
由于tab和空格混用而导致的问题,解决办法如下: 在SubLime中View中的Identation中的Convert Indentitation to Spaces即可
P2341 [HAOI2006]受欢迎的牛
P2341 [HAOI2006]受欢迎的牛塔尔羊标准模板(我才不会告诉你我嘴里含着一个九省联考的出题人) 不会劈配.林克卡特树.制胡窜我还会叉粪宿主,梳妆素组,西安段素 #include<c ...
Java常见加密技术的密钥与加密串长度
Java常见的Java方式 1.Base64编码 2.十六进制(Hex)编码 3.MD消息摘要 4.DES加密 5.3DES加密 6.AES加密 6.RSA加密
C# 操作符与表达式
C#保留了C++所有的操作符,其中指针操作符(*和->)与引用操作符(&)需要有unsafe的上下文.C#摈弃了范围辨析操作符(::),一律改为单点操作符(.).我们不再阐述那些保留的C ...
uplift model学习笔记
一.解决的问题: 通常的 Propensity Model 和 Response Model 只是给目标用户打了个分,并没有确保模型的结果可以使得活动的提升最大化:它没有告诉市场营销人员,哪个用户最有 ...
多线程（threading module）
一.线程与进程线程定义:线程是操作系统能够进行运算调度的最小单位.它被包含在进程之中,是进程中的实际运作单位.一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不 ...
利用pandas和numpy计算表中每一列的均值
import numpy as np import pandas as pd df = pd.DataFrame({'var1':np.random.rand(100), #生成100个0到1之间的随 ...
找回被丢弃怎么找都找不回来的git中的commit
崩溃的一天,打算提代码走人,结果切分支之后,commit丢了= =,找了三个多小时接下来分享下如何找回丢失的commit的打开项目所在位置,打开git bash,在gitBASH中输入 git f ...
urllib使用一
urllib.urlopen()方法: 参数: 1.url(要访问的网页链接http:或者是本地文件file:) 2.data(如果有,就会由GET方法变为POST方法,提交的数据格式必须是appli ...