Encoder-Decoder、Seq2Seq、Attention

传送门1：Encoder-Decoder 和 Seq2Seq

因为注意力不集中，所以这篇随笔就是看别人的文章，随手参考写写的。

1.Encoder-Decoder

Encoder-Decoder模型并不特指某种具体算法，而是一种通用的框架，这个框架下可以使用不同的算法来解决不同的任务。

Encoder-Decoder框架诠释了机器学习的核心思路：将现实问题转化为数学问题，通过求解数学问题，从而解决现实问题。

Encoder又称为编码器，作用就是：将现实问题转化为数学问题。

将文字/图片/音频等作为输入，通过Encoder编码器，输出向量。

Decoder又称为解码器，作用就是：求解数学问题，并转化为现实世界的解决方案。

将向量作为输入，通过Decoder解码器，输出文字等。

结合起来就是：Encoder将现实世界的问题转化成向量C，然后传给Decoder，Decoder通过向量，求解数学问题，然后转化为现实世界的解决方案。

其中2点注意：

1.无论输入和输出的长度是什么，中间的向量C都是固定长度的。

2.根据不同的任务可以选择不同的编码器和解码器。

以上，符合的都统称为Encoder-Decoder模型。

个人理解：只要有现实的输入，通过转化为向量，然后解决这个向量的数学问题，然后再转化为现实的，就是Encoder-Decoder模型。

因为电脑无法直接处理现实问题，所以要转化成数学问题，解决完之后再转化为现实的解决方案。

因为Encoder-Decoder之间的向量C是定长的，所以存在缺陷，因为不管信息是多还是少，只能表示定长的信息，所以当输入信息太长的时候，会丢失掉一些信息。

举例：图片压缩，800*800像素压缩成100KB和3000*3000像素压缩成100KB，3000*3000像素的压缩之后，图片就比800*800像素压缩的模糊。

2.Seq2Seq

Seq2Seq：Sequence-to-Sequence，序列到序列。

输入序列和输出序列的长度是可变的。

比如翻译：

I am a dog.

我是一只小狗。

输入的是4个英文单词，输出的是6个汉字。

Seq2Seq的产生是因为，机器翻译，语音识别图像描述生成等，长度事先不知道，无法固定长度，所以产生了这个框架。

Seq2Seq(强调目的)，不特指方法，满足输入序列，输出序列的，都统称为Seq2Seq模型，具体方法都基本属于Encoder-Decoder模型(强调方法)的范围。

3.Attention

前面的Encoder-Decoder因为存在信息过长，信息丢失的问题，所以Attention机制的出现，来解决这个问题。

Attention的特点是Encoder不再将整个输入序列编码为固定长度的中间向量C，而是编码为一个向量的序列。

具体的前面写过一篇博客，但是那篇也是水的，所以，具体的涉及到公式代码的，还需要些时日。

传送门2：深度学习/NLP中的Attention注意力机制

暂时先这样，溜了。

Encoder-Decoder、Seq2Seq、Attention的更多相关文章

完全图解RNN、RNN变体、Seq2Seq、Attention机制
完全图解RNN.RNN变体.Seq2Seq.Attention机制本文主要是利用图片的形式,详细地介绍了经典的RNN.RNN几个重要变体,以及Seq2Seq模型.Attention机制.希望这篇文章 ...
RNN、LSTM、Seq2Seq、Attention、Teacher forcing、Skip thought模型总结
RNN RNN的发源: 单层的神经网络(只有一个细胞,f(wx+b),只有输入,没有输出和hidden state) 多个神经细胞(增加细胞个数和hidden state,hidden是f(wx+b) ...
keras系列︱seq2seq系列相关实现与案例（feedback、peek、attention类型）
之前在看<Semi-supervised Sequence Learning>这篇文章的时候对seq2seq半监督的方式做文本分类的方式产生了一定兴趣,于是开始简单研究了seq2seq.先 ...
NLP教程(6) - 神经机器翻译、seq2seq与注意力机制
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/36 本文地址:http://www.showmeai.tech/article-det ...
attention、self-attention、transformer和bert模型基本原理简述笔记
attention 以google神经机器翻译(NMT)为例无attention: encoder-decoder在无attention机制时,由encoder将输入序列转化为最后一层输出state ...
H.264 Profile、Level、Encoder三张简图 (fps = AVCodecContext->time_base.den / AVCodecContext->time_base.num)
H.264 Profiles Profiles are sets of capabilities. If your black box only supports the Baseline profi ...
logback：logback和slf4j中的：appender、logger、encoder、layout
(1)appender 1.appender标签是logback配置文件中重要的组件之一.在logback配置文件中使用appender标签进行定义.可以包含0个或多个appender标签. 2.a ...
学习笔记CB013: TensorFlow、TensorBoard、seq2seq
tensorflow基于图结构深度学习框架,内部通过session实现图和计算内核交互. tensorflow基本数学运算用法. import tensorflow as tf sess = tf.S ...
Burpsuite 工具详解（常用模块之proxy、spider 、decoder）
Burpsuite常用模块之proxy.spider .decoder 是一款集成化渗透测试工具(jav ...
6. 从Encoder-Decoder(Seq2Seq)理解Attention的本质
1. 语言模型 2. Attention Is All You Need(Transformer)算法原理解析 3. ELMo算法原理解析 4. OpenAI GPT算法原理解析 5. BERT算法原 ...

随机推荐

开源免费的专注于建立大型个人知识库推荐-Trilium Notes
Trilium Notes是一个分层的笔记应用程序,专注于建立大型个人知识库. 支持相当丰富的 markdown,包括 mermaid 和 latex,而且即时渲染,和 typora 一样.支持代码类 ...
webgl径向模糊实现体积光
体积光介绍首先,我们要确认一下什么是体积光.体积光通俗来说是我们能看见的"光路",并不是所有灯光都会形成体积光效果,它是光照到大气中粒子散射后得到的效果(丁达尔效应).我们有时候 ...
linux date格式化获取时间
转载请注明出处: 在编写shell脚本时,需要在shell脚本中格式化时间,特此整理下date命令相关参数的应用 root@controller1:~# date --help 用法:date [选项 ...
奇怪的回溯增加了 | leetcode131分割回文串
题目要求:给你一个字符串 s,请你将s分割成一些子串,使每个子串都是回文串.返回 s 所有可能的分割方案示例 1: 输入:s = "aab" 输出:[["a" ...
java实现二维码登录功能
本文采用Springboot工程进行开发,使用Google的zxing生成二维码,直接放代码: <?xml version="1.0" encoding="UTF- ...
Python获取指定网段正在使用的IP
Python获取指定网段正在使用的IP #!/usr/bin/env python # -*- coding: utf-8 -*- ''''' 使用方法样例 python test20.py 192. ...
【Vue2】Filter 过滤器
过滤器案例: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UT ...
【Centos】RPM安装Mysql8
先去官网下载RPM包,没想到RPM包是红帽发行版 https://dev.mysql.com/downloads/mysql/ 使用wget直接下载到Centos里面: wget https://cd ...
一个好主板对CPU超频的现实意义————一次超频经历（z390ws华硕工作站主板+i7-9700k CPU ，Ubuntu18.04.5系统，8核心超频 5.2Ghz以上，单核心满负荷运转可以稳定运行10多分钟后才重启）
本人于今年2020年1月份在某宝上购买了一款workstation主板,也就是工作站主板,传说中的华硕Z390WS主板(购入价格为3900元),由于当时手里有些小钱,又弄了一个大蝴蝶1350w的电源( ...
机器学习中的权重衰退 —— 深度学习中的权重衰退 —— 权重衰退 —— weight decay
在看代码时看到了这个概念,以前虽然也看到过但是没有太在意,再次看到于是研究了一下. 引自: https://sota.jiqizhixin.com/models/methods/0bdb8f87-9c ...

Encoder-Decoder、Seq2Seq、Attention

Encoder-Decoder、Seq2Seq、Attention的更多相关文章

随机推荐

热门专题