seq2seq聊天模型(一)

潘峰YiRan 2024-10-25 21:59:10 原文

原创文章，转载请注明出处

最近完成了sqe2seq聊天模型，磕磕碰碰的遇到不少问题，最终总算是做出来了，并符合自己的预期结果。

本文目的

利用流程图，从理论方面，回顾，总结seq2seq模型,

seq2seq概念

你给模型一段输入，它返回一段输出！

可以用在这些情景，聊天模型、翻译、看图说话、主旨提取等等涉及自然语言的层面，用途较广泛

例如：

输入"今天中午吃什么",

输出"吃兰州拉面"。

seq2seq是通过encoder编译器将一段输入，编译，汇聚成一个状态。再通过decoder解析器，解析该状态，返回一个输出！

encoder和decoder都是建立再LSTM或者RNN的基础上。

## 运行流程

1. 分词

输入"今天中午吃什么"

通过结巴分词工具，分词为["今天", "中午", "吃", "什么"]

输出结果为：输入通过seq2seq的计算后，输出结果为["吃", "拉州", "拉面"]

2. 分词向量化

对于分词最终都会转换为相应的向量

我采用了两种方法，将分词转换为向量

1.随机定义分词的向量，训练过程中，不断的修改，最终形成分词向量。

（下面代码，可以忽略）

 self.dec_Wemb = tf.get_variable('embedding',

                       initializer=tf.random_uniform([dec_vocab_size + 2, self.dec_emb_size]),

                       dtype=tf.float32)

2.使用gesim工具，将分词转换为向量。(我认为这个好，拓展性广很多)

for world in all_words_list:

    # ["_GAO_", "_PAD_", "*",

    if world == "_GAO_" or world == "_PAD_" or world == "*":

        continue

    try:

        embedding.append(model[world].tolist())

    except KeyError:

        embedding.append([0.5] * vim)

3.seq2seq核心运作如下流程图

这里是基础模型(还有attention模型，schedule模型等)

模型的核心点都是在encoder处，编译整理输入状态，传递给decoder解析器，解析得到结果！

seq2seq聊天模型(一)的更多相关文章

seq2seq聊天模型（三）—— attention 模型
注意力seq2seq模型大部分的seq2seq模型,对所有的输入,一视同仁,同等处理. 但实际上,输出是由输入的各个重点部分产生的. 比如: (举例使用,实际比重不是这样) 对于输出"晚上 ...
seq2seq聊天模型（二）——Scheduled Sampling
使用典型seq2seq模型,得到的结果欠佳,怎么解决结果欠佳原因在这里在训练阶段的decoder,是将目标样本["吃","兰州","拉面" ...
pytorch做seq2seq注意力模型的翻译
以下是对pytorch 1.0版本的seq2seq+注意力模型做法语--英语翻译的理解(这个代码在pytorch0.4上也可以正常跑): # -*- coding: utf-8 -*- " ...
深度学习教程 | Seq2Seq序列模型和注意力机制
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/35 本文地址:http://www.showmeai.tech/article-det ...
我用 tensorflow 实现的“一个神经聊天模型”：一个基于深度学习的聊天机器人
概述这个工作尝试重现这个论文的结果 A Neural Conversational Model (aka the Google chatbot). 它使用了循环神经网络(seq2seq 模型)来进行 ...
Seq2Seq sequence-to-sequence模型简介
Sequence-to-sequence (seq2seq) 模型. 突破了传统的固定大小输入问题框架开创了将DNN运用于翻译.聊天(问答)这类序列型任务的先河并且在各主流语言之间的相互翻译,和语 ...
一个关于vue+mysql+express的全栈项目（六）------ 聊天模型的设计
一.数据模型的设计这里我们先不讨论群聊的模型,指讨论两个人之间的聊天,我们可以把两个人实时聊天抽象为(点对点)的实时通讯,如下图我们上面的所说的模型其实也就是数据包的模型应该怎么设计,换句话说就是 ...
基于PyTorch的Seq2Seq翻译模型详细注释介绍（一）
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明.本文链接:https://blog.csdn.net/qysh123/article/detai ...
深度学习之seq2seq模型以及Attention机制
RNN,LSTM,seq2seq等模型广泛用于自然语言处理以及回归预测,本期详解seq2seq模型以及attention机制的原理以及在回归预测方向的运用. 1. seq2seq模型介绍 seq2se ...

随机推荐

设置阿里云镜像仓库并安装Docker
echo "设置阿里云镜像仓库" mkdir /etc/yum.repos.d/bak && mv /etc/yum.repos.d/*.repo /etc/yum ...
JS基础_构造函数修改
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
JS基础_函数作用域练习
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
restTemplate源码解析（一）构造restTemplate的Bean实例
所有文章 https://www.cnblogs.com/lay2017/p/11740855.html 正文构造一个restTemplate的Bean实例很容易,只需这样配置 @Bean publ ...
一：项目简介（node express vue elementui axios）
一:项目基本构造 ** 项目一共有 16 个页面,是一个电商网销项目,自己在网上的某网上找的一个要做的网站的设计图: 页面主要包括: 登录页 -- 注册页 -- 首页 -- 产品列表页 -- 产品详 ...
vue在axios中 this 指向问题
1.解决办法在vue中使用axios做网络请求的时候,会遇到this不指向vue,而为undefined,可以使用箭头函数"=>"来解决.如下: methods: { lo ...
S2-048
前言 S2-048漏洞和struts2-struts1-plugin插件有关,该插件用于将Struts1的action也能在struts2上运行,提高兼容性(作用是我猜的~) 正文我们先看下这个插件 ...
在IOS中根据圆心坐标、半径和角度计算圆弧上的点坐标
/** 日期:2015-10-15 版本: 1.0.0 -------------------------------------------------------------- 功能说明 ---- ...
LINUX档案权限
一.ls命令显示目录详细信息列表显示目录内容 : ls drwxr-xr-x. 4 root root 4096 Jun 26 02:07 acpi -rw-r--r--. 1 ...
记录一次OOM排查经历
我是用了netty搭建了一个UDP接收日志,堆启动配置 Xmx256 Xms256 ,项目刚启动的时候,系统进程占用内存很正常,在250M左右. 长时间运行之后发现,进程占用内存不断增长,远远超过了 ...