deeplearning.ai 序列模型 Week 3 Sequence models & Attention mechanism

1. 基础模型 A. Sequence to sequence model:机器翻译.语音识别.(1. Sutskever et. al., 2014. Sequence to sequence learning with neural networks. 2. Cho et. al., 2014. Learning phrase representations using RNN encoder-decoder for statistical machine translation.) B…

吴恩达《深度学习》-第五门课序列模型(Sequence Models)-第三周序列模型和注意力机制（Sequence models & Attention mechanism）-课程笔记

第三周序列模型和注意力机制(Sequence models & Attention mechanism) 3.1 序列结构的各种序列(Various sequence to sequence architectures) 首先,我们先建立一个网络,这个网络叫做编码网络(encoder network)(上图编号 1 所示),它是一个 RNN 的结构, RNN 的单元可以是 GRU 也可以是 LSTM.每次只向该网络中输入一个法语单词,将输入序列接收完毕后,这个 RNN 网络会输出一个向量来代表…

[C5W3] Sequence Models - Sequence models & Attention mechanism

第三周序列模型和注意力机制(Sequence models & Attention mechanism) 基础模型(Basic Models) 在这一周,你将会学习 seq2seq(sequence to sequence)模型,从机器翻译到语音识别,它们都能起到很大的作用,从最基本的模型开始.之后你还会学习集束搜索(Beam search)和注意力模型(Attention Model),一直到最后的音频模型,比如语音. 现在就开始吧,比如你想通过输入一个法语句子,比如这句 "Jane…

deeplearning.ai 序列模型 Week 1 RNN（Recurrent Neural Network）

1. Notations 循环序列模型的输入和输出都是时间序列.$x^{(i)<t>}$表示第$i$个输入样本的第$t$个元素,$T_x^{(i)}$表示输入的第$i$个样本的元素个数:$y^{(i)<t>}$表示第$i$个样本的输出的第$t$个元素,$T_y^{(i)}$表示第$i$个样本的输出的元素个数. 在NLP领域,为了描述一句话,会有一个词典(vocabulary),里面保存了所有的英文单词(一般包含3万到5万单词),每个单词依次有一个编号.这样每个单词都可以用一个向量表…

Coursera Deep Learning笔记序列模型（三）Sequence models & Attention mechanism(序列模型和注意力机制)

参考 1. 基础模型(Basic Model) Sequence to sequence模型(Seq2Seq) 从机器翻译到语音识别方面都有着广泛的应用. 举例: 该机器翻译问题,可以使用"编码网络(encoder network)"+"解码网络(decoder network)"两个RNN模型组合的形式来解决. encoder network将输入语句编码为一个特征向量,传递给decoder network,完成翻译.具体模型结构如下图所示: 其中,encoder…

课程五(Sequence Models)，第三周（Sequence models & Attention mechanism） —— 2.Programming assignments：Trigger word detection

Expected OutputTrigger Word Detection Welcome to the final programming assignment of this specialization! In this week's videos, you learned about applying deep learning to speech recognition. In this assignment, you will construct a speech dataset a…

课程五(Sequence Models)，第三周（Sequence models & Attention mechanism） —— 1.Programming assignments：Neural Machine Translation with Attention

Neural Machine Translation Welcome to your first programming assignment for this week! You will build a Neural Machine Translation (NMT) model to translate human readable dates ("25th of June, 2009") into machine readable dates ("2009-06-25…

Coursera, Deep Learning 5, Sequence Models, week3, Sequence models & Attention mechanism

Sequence to Sequence models basic sequence-to-sequence model: basic image-to-sequence or called image captioning model: but there are some differences between how you write a model like this to generate a sequence, compared to how you were synthesizi…

deeplearning.ai 序列模型 Week 2 NLP & Word Embeddings

1. Word representation One-hot representation的缺点:把每个单词独立对待,导致对相关词的泛化能力不强.比如训练出“I want a glass of orange juice”后,面对“I want a glass of apple ”,由于任何两个不同单词的one-hot vector的内积都为0,算法不知道orange和apple是一类词,所以没办法泛化出在apple后面填“juice”. Featurized represent…

课程五(Sequence Models)，第三周（Sequence models & Attention mechanism） —— 0.Practice questions：Sequence models & Attention mechanism

…

Sequence Models 笔记（二）

2 Natural Language Processing & Word Embeddings 2.1 Word Representation(单词表达) vocabulary,每个单词可以使用1-hot表示,写作$O^{5391}$之类,上标可以变.只是用1-hot,不能知道任意两个单词的关系,例如man/woman;king/queen;apple/orange. 特征化表示:词嵌入(Featurized representation:word embedding).一个特征,使用-1到…

Sequence Models

Sequence Models This is the fifth and final course of the deep learning specialization at Coursera which is moderated by deeplearning.ai Here are the course summary as its given on the course link: This course will teach you how to build models for n…

[C7] Andrew Ng - Sequence Models

About this Course This course will teach you how to build models for natural language, audio, and other sequence data. Thanks to deep learning, sequence algorithms are working far better than just two years ago, and this is enabling numerous exciting…

【Deeplearning.ai 】吴恩达深度学习笔记及课后作业目录

吴恩达深度学习课程的课堂笔记以及课后作业代码下载:https://github.com/douzujun/Deep-Learning-Coursera 吴恩达推荐笔记:https://mp.weixin.qq.com/s/cX9_DiqofPhdXrY_0oTEAw 课程1 - 神经网络和深度学习周数名称类型地址 week1 深度学习简介测验略 week2 神经网络基础笔记逻辑回归逻辑回归推导具有神经网络思维的Logistic回归编程作业识别猫 week3 浅层神经网络…

吴恩达《深度学习》-第五门课序列模型(Sequence Models)-第一周循环序列模型（Recurrent Neural Networks） -课程笔记

第一周循环序列模型(Recurrent Neural Networks) 1.1 为什么选择序列模型?(Why Sequence Models?) 1.2 数学符号(Notation) 这个输入数据是 9 个单词组成的序列,所以会有 9 个特征集和来表示这 9 个单词,并按序列中的位置进行索引,用\(…

DeepLearning.ai学习笔记（五）序列模型 -- week1 循环序列模型

一.为什么选择序列模型序列模型可以用于很多领域,如语音识别,撰写文章等等.总之很多优点... 二.数学符号为了后面方便说明,先将会用到的数学符号进行介绍. 以下图为例,假如我们需要定位一句话中人名出现的位置. 红色框中的为输入.输出值.可以看到人名输出用1表示,反之用0表示: 绿色框中的$x^{<t>},y^{<t>}$表示对应红色框中的输入输出值的数学表示,注意从1开始. 灰色框中的$T_x,T_y$分别表示输入输出序列的长度,在该例中,$T_x=9,T_y=9$…

吴恩达DeepLearning.ai的Sequence model作业Dinosaurus Island

目录 1 问题设置 1.1 数据集和预处理 1.2 概览整个模型 2. 创建模型模块 2.1 在优化循环中梯度裁剪 2.2 采样 3. 构建语言模型 3.1 梯度下降 3.2 训练模型 4. 结论本文是DeepLearning.ai的第五门课作业: Character level language model - Dinosaurus Island 1 问题设置欢迎来到恐龙岛! 6500万年前,恐龙就已经存在,并且在这种任务下它们又回来了.你负责一项特殊任务.领先的生物学研究…

Deep Learning.ai学习笔记_第五门课_序列模型

目录第一周循环序列模型第二周自然语言处理与词嵌入第三周序列模型和注意力机制第一周循环序列模型在进行语音识别时,给定一个输入音频片段X,并要求输出对应的文字记录Y,这个例子中输入和输出数据就是序列模型. 音乐生产问题也是使用序列数据的一个例子. 在自然语言处理中,首先需要决定怎样表示一个序列里单独的单词,解决办法式创建一个词典.然后每个单词的序列表示可以使用该词典长度的一维数组来表示,匹配的位置数据为1,其它位置数据为0. 下面看一个循环神经网络模型: RNN反向传播示意图: 如…

deeplearning.ai课程学习（1）

本系列主要是我对吴恩达的deeplearning.ai课程的理解和记录,完整的课程笔记已经有很多了,因此只记录我认为重要的东西和自己的一些理解. 第一门课神经网络和深度学习(Neural Networks and Deep Learning) 第一周:深度学习引言(Introduction to Deep Learning) 1.常用神经网络的结构与对应的数据类型数据类型结构化数据:表格类型的数据,有明确的行和列. 非结构化数据:音频.视频.图像.文本等类型的数据. 网络结构标准的NN结…

吴恩达deepLearning.ai循环神经网络RNN学习笔记_看图就懂了！！！(理论篇)

前言目录: RNN提出的背景 - 一个问题 - 为什么不用标准神经网络 - RNN模型怎么解决这个问题 - RNN模型适用的数据特征 - RNN几种类型 RNN模型结构 - RNN block - 简化符号表示 - stacked RNN - 双向RNN - 梯度消失爆炸问题 GRU模型结构 LSTM模型结构 - LSTM背后的关键思想 - Step by Step理解LSTM 本文可以解答: RNN用来解决什么问题,什么样的数据特征适合用它来解决 RNN的缺陷是什么,LSTM,GRU是如何…

吴恩达deepLearning.ai循环神经网络RNN学习笔记_没有复杂数学公式，看图就懂了！！！(理论篇)

本篇文章被Google中国社区组织人转发,评价: 条理清晰,写的很详细! 被阿里算法工程师点在看! 所以很值得一看! 前言目录: RNN提出的背景 - 一个问题 - 为什么不用标准神经网络 - RNN模型怎么解决这个问题 - RNN模型适用的数据特征 - RNN几种类型 RNN模型结构 - RNN block - 简化符号表示 - stacked RNN - 双向RNN - 梯度消失爆炸问题 GRU模型结构 LSTM模型结构 - LSTM背后的关键思想 - Step by Step理解LSTM…

Coursera机器学习+deeplearning.ai+斯坦福CS231n

日志 20170410 Coursera机器学习 2017.11.28 update deeplearning 台大的机器学习课程:台湾大学林轩田和李宏毅机器学习课程 Coursera机器学习 Week 5: Neural Networks: Learning 本来上周开始该学习这个内容,也是先提交了作业,今天才来看看具体的代码:感觉这个课程本身对基础巩固很好.没有连续学习感觉有些有点忘了,最终的目的是自己能够推导这个内容. 本来想跟着学习搞个电子证书的,结果申请的到期时间是2017.3.31;…

deeplearning.ai学习RNN

一.RNN基本结构普通神经网络不能处理时间序列的信息,只能割裂的单个处理,同时普通神经网络如果用来处理文本信息的话,参数数目将是非常庞大,因为如果采用one-hot表示词的话,维度非常大. RNN可以解决这两个问题: 1)RNN属于循环神经网络,当从左到右读取文本信息的时候,上一时刻的状态输出可以传递到下一时刻,例如上图的a表示状态,a(1)向下传递,这样就考虑了前面的信息,如果是双向RNN的话,上下文都考虑进去了. 2)RNN参数是共享的.为方便理解,上述图示是展开的RNN结构,其实RNN只…

[C5W1] Sequence Models - Recurrent Neural Networks

第一周循环序列模型(Recurrent Neural Networks) 为什么选择序列模型?(Why Sequence Models?) 在本课程中你将学会序列模型,它是深度学习中最令人激动的内容之一.循环神经网络(RNN)之类的模型在语音识别.自然语言处理和其他领域中引起变革.在本节课中,你将学会如何自行创建这些模型.我们先看一些例子,这些例子都有效使用了序列模型. 在进行语音识别时,给定了一个输入音频片段 $X$,并要求输出对应的文字记录 $Y$.这个例子里输入和输出数据都是序列…

Empirical Analysis of Beam Search Performance Degradation in Neural Sequence Models

Empirical Analysis of Beam Search Performance Degradation in Neural Sequence Models 2019-06-13 10:28:44 Paper: [abs] [Download PDF][Supplementary PDF] Eldan Cohen, Christopher Beck ; PMLR 97:1290-1299 1. Background and Motivation: Beam search 是一种常用在…

《Sequence Models》课堂笔记

Lesson 5 Sequence Models 这篇文章其实是 Coursera 上吴恩达老师的深度学习专业课程的第五门课程的课程笔记. 参考了其他人的笔记继续归纳的. 符号定义假如我们想要建立一个能够自动识别句中人名地名等位置的序列模型,也就是一个命名实体识别问题,这常用于搜索引擎.命名实体识别系统可以用来查找不同类型的文本中的人名.公司名.时间.地点.国家名和货币名等等. 我们输入语句 "Harry Potter and Herminoe Granger invented a new s…

开始 Keras 序列模型（Sequential model）

开始 Keras 序列模型(Sequential model) 序列模型是一个线性的层次堆栈. 你可以通过传递一系列 layer 实例给构造器来创建一个序列模型. The Sequential model is a linear stack of layers. You can create a Sequential model by passing a list of layer instances to the constructor: from keras.models import Se…