DLNg第三周：序列模型和注意力机制

lypbendlf 2024-10-15 10:18:35 原文

1.基础模型

将法语翻译为英语，分为编码和解码阶段，将一个序列变为另一个序列。即序列对序列模型。

从图中识别出物体的状态，将图片转换为文字。

先使用CNN处理图片，再使用RNN将其转换为语言描述。

2.选择最可能的句子

7.注意力模型直观理解

绿色部分是输入法语句子并记忆，在感知机中传递，紫色是解码网络，生成英文翻译；

人翻译的时候会选择看一段翻译一段，而在NN中如果是记忆整个句子，那效果就如Blue得分的蓝线随着单词的增长而降低。

在神经网络中，记忆长句子是很困难的。

使用双向RNN获取特征集，使用另一个RNN来进行翻译。

在预测第一个单词Jane时，需要考虑法语中jane和其附近的词，这时会根据距离给予每个单词一个注意力权重，

比如对jane是α<1,1>,visite是a<1,2>,l'Afrique是a<1,3>这样将原来的网络输入根据不同的权重来预测单词Jane;

在生成第二个单词的时候，又会有（紫色笔）不同的注意力权重，并且输入上一个单元的输出；绿色笔是预测第三个词。

α<t,t’>会告诉在尝试生成第T个英文单词，应该花多少注意力在第t个法语词上，当生成一个特定的英文词时，它允许在每个时间步内去看周围词距内的法语需要多少注意力。

8.注意力模型

是将上一节的进行了一点展开讲解，对于预测某一单词，Σα<1,t'>=1，是说在生成第一个单词的时候，总共t'个可影响的单词，它们的影响总和为1，并且状态C是根据其对应的注意力来计算的。

softmax函数能够保证和为1，左下角的图输入为上一个预测结果和当前词的Attention，右下角的图也就是左下角的具体化。

右下角的图左边是出入，上面是输出，能够发现注意力？？

DLNg第三周：序列模型和注意力机制的更多相关文章

吴恩达《深度学习》-第五门课序列模型(Sequence Models)-第三周序列模型和注意力机制（Sequence models & Attention mechanism）-课程笔记
第三周序列模型和注意力机制(Sequence models & Attention mechanism) 3.1 序列结构的各种序列(Various sequence to sequence ...
深度学习教程 | Seq2Seq序列模型和注意力机制
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/35 本文地址:http://www.showmeai.tech/article-det ...
DeepLearning.ai学习笔记（五）序列模型 -- week2 序列模型和注意力机制
一.基础模型假设要翻译下面这句话: "简将要在9月访问中国" 正确的翻译结果应该是: "Jane is visiting China in September" ...
ng-深度学习-课程笔记-17: 序列模型和注意力机制(Week3)
1 基础模型(Basic models) 一个机器翻译的例子,比如把法语翻译成英语,如何构建一个神经网络来解决这个问题呢? 首先用RNN构建一个encoder,对法语进行编码,得到一系列特征然后用R ...
Coursera Deep Learning笔记序列模型（三）Sequence models & Attention mechanism(序列模型和注意力机制)
参考 1. 基础模型(Basic Model) Sequence to sequence模型(Seq2Seq) 从机器翻译到语音识别方面都有着广泛的应用. 举例: 该机器翻译问题,可以使用" ...
Seq2Seq模型与注意力机制
Seq2Seq模型基本原理核心思想:将一个作为输入的序列映射为一个作为输出的序列编码输入解码输出解码第一步,解码器进入编码器的最终状态,生成第一个输出以后解码器读入上一步的输出,生成当前步 ...
Deep Learning.ai学习笔记_第五门课_序列模型
目录第一周循环序列模型第二周自然语言处理与词嵌入第三周序列模型和注意力机制第一周循环序列模型在进行语音识别时,给定一个输入音频片段X,并要求输出对应的文字记录Y,这个例子中输入和输出 ...
[DeeplearningAI笔记]序列模型3.7-3.8注意力模型
5.3序列模型与注意力机制觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.7注意力模型直观理解Attention model intuition 长序列问题 The problem of ...
[DeeplearningAI笔记]序列模型3.9-3.10语音辨识/CTC损失函数/触发字检测
5.3序列模型与注意力机制觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.9语音辨识 Speech recognition 问题描述对于音频片段(audio clip)x ,y生成文本 ...

随机推荐

Linux中 SonarQube代码质量管理平台安装
SonarQube是管理代码质量一个开源平台,可以快速的定位代码中潜在的或者明显的错误. SonarQube安装 1.环境准备 (1)sonarQube 下载地址https://www.sonarqu ...
mui---获取上一级窗口
我们在用MUI做APP的时候,会用到要获取上一级的窗口.具体方法:获取当前webview窗口的创建者. 代码: plus.webview.currentWebview().opener();
http方式访问svn
接下来做一下svn的http访问首先,说一下,svn的http访问时依赖apache的dav_svn模块,然后赋予www-data访问权限,进行版本控制我的服务器环境Ubuntu16.04 准备工 ...
我的阿里、腾讯暑期实习Offer经历
三四月份对我拿来说是个忙碌的两个月,实验室项目到了关键的时刻,自己又需要抽身去找暑期实习,总之过得很快.值得欣慰的是幸运的拿到了阿里和腾讯的暑期实习offer,也算是对三四月份的忙碌一些回报吧.阿里的 ...
品尝阿里云容器服务：5个2核4G节点使用情况记载
使用5台2核4G非IO优化的ECS作为节点创建集群,节点操作系统是Ubuntu 16.04.2 LTS.创建后3个为mananger节点,2个为worker节点,每个节点默认会运行7个容器,其中3个s ...
【紫书】Urban Elevations UVA - 221 离散化
题意:给你俯视图,要求依次输出正视图中可以看到的建筑物题解:任意相邻的x间属性相同,所以离散化. 坑:unique只能对数组用.下标易错 list不能找某元素的next.用了个很麻烦的处理数组: ...
源码编译安装nginx
安装依赖软件 1.安装编译工具gcc gcc是一个开源编译器集合,用于处理各种各样的语言:C.C++.Java.Ada等,在linux世界中是最通用的编译器,支持大量处理器:x86.AMD64.Pow ...
栈帧 2.6. Frames 虚拟机内存模型
https://docs.oracle.com/javase/specs/jvms/se11/html/jvms-2.html#jvms-2.6 小结: 1. https://docs.oracle. ...
Linux之sed、awk
Linux 之AWK 命令简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在对数据分析并生成报告时,显得尤为强大. 简单来说awk就是把文件逐行的读入,以空格默认分隔 ...
python 遍历list并删除部分元素
python 遍历list并删除部分元素https://blog.csdn.net/afgasdg/article/details/82844403有两个list,list_1 为0-9,list_2 ...