短文对话的神经反应机 -- Neural Responding Machine for Short-Text Conversation学习笔记

　　最近学习了一篇ACL会议上的文章，讲的是做一个短文对话的神经反映机，

　　原文：

　　会议：ACL（2015）

　　文章条目： Lifeng Shang, Zhengdong Lu, Hang Li:

　　Neural Responding Machine for Short-Text Conversation. 1577-1586

　　写下学习笔记：

　　拓展：Attention Model 注意力模型，本文中提到所采用的Encoder-Decoder框架。

　　可以把它看作适合处理由一个句子（或篇章）生成另外一个句子（或篇章）的通用处理模型。

　　 X表示输出的句子，Y表示输出的句子。

　　Encoder对输入句子进行编码，转化成中间语义表示

　　Decoder对中间语义及已经生成的历史信息y1,y2,…生成i时刻要生成的单词yi，很多个yi串起来就形成了Y，即输出的句子。

　　其中编码和解码都有很多可用的神经网络模型，如CNN/RNN/LSTM/深度LSTM等等，有很多种组合可以尝试。在文本处理中比较常见的Endocer和Decoder都采用RNN模型。

　　而本文也采用了seq2seq(Sequence to Sequence)模型，该模型可以运用在很多地方，比如说文章自动摘要、机器翻译、人机对话等等。(其实就是一个Encoder和Decoder模型，然后Encoder和Decoder用的都是RNN中的GRU网络)。因此本文中的Encoder-Decoder模型本质上来说应该是这样的：

　　Short-Text Conversation（STC）指的是单轮对话任务——也就是对于每一个输入post给出一个对应的response。以往的STC方法主要有两种：检索式的方法（retrieval-based method）和统计机器翻译（statistical machine learning， SMT）。但是检索式的事先都固定好了，太缺乏多样性，而统计机器翻译将它作为一个翻译任务，而有时候post和respond是完全没有一点语义关系的。

　　本文采取通用的Encoder-Decoder模型，同时利用了seq2seq模型，在编码和解码的过程中都用的是循环神经网络CNN中的GRU（没有用LSTM是因为LSTM的参数太多，用GRU相对简单一些并且效果还不错），并设计了一个基于神经网络的短文对话响应机NRM(相当于机器对话)，训练数据是通过微博收集的大量一轮的对话。

　　首先获取数据，遵从经典的步骤，首先是删除无意义词如”wow”；筛除广告；只留前30个人的回复。

　　接下来转化的模型：

　　主要是这个L很重要，要能够表示输入句子的特性，这里要用到注意力模型确定h中的哪一步分需要着重考虑。由输入数据和y1,y2,…yi-1决定。

　　解码用到下面的模型：

　　虚线代表 g(.) ，实线代表 f(.)

　　编码方案提出了三种：

　　global scheme（NRM-glo）：

简单定义 hT 为Ct

　　local scheme（NRM-loc）：

　　这里用到了注意力模型（AM模型），动态决定，而，

　　hybrid scheme combines the aforementioned 2（NRM-hyb）：

　　第一种全局的方法能抓住post的全局特征，而第二种局部的方法能倚靠AM模型选择不同位置的单词作为重要特征，因此第三种方法可以混合一下前两种方法。模型如下：

　　实验证明检索式的方法效果和NRM-glo差不多，因为它基本使用的都是预定义的responses，不会有一些语法上的问题，同时匹配特征保证了responses和post的相关性，

因此从表面上看来这是最合适的回答，但是实际上它只是重复了post说的内容而已，而NRM-hyb结合了global和local的优点之后，performance明显好于其他方法。

短文对话的神经反应机 -- Neural Responding Machine for Short-Text Conversation学习笔记的更多相关文章

Neural Turing Machine - 神经图灵机
Neural Turing Machine - 神经图灵机论文原文地址: http://arxiv.org/pdf/1410.5401.pdf 一般的神经网络不具有记忆功能,输出的结果只基于当前的输 ...
Dynamic CRM 2013学习笔记（四十）流程3 - 对话（Dialog）用法图解
我们将用对话来实现一个简单的满意度调查,下一个问题依赖于上一个问题.对话是同步的,不同于工作流既可以是同步也可以是异步的:对话可以跟用户互动:对话只能手动开始:对话只支持 .Net Framework ...
Phrase-Based & Neural Unsupervised Machine Translation基于短语非监督机器翻译
1. 前言本文介绍一种无监督的机器翻译的模型.无监督机器翻译最早是<UNSUPERVISED NEURAL MACHINE TRANSLATION>提出.这个模型主要的特点,无需使用平行 ...
深度学习笔记 (一) 卷积神经网络基础 (Foundation of Convolutional Neural Networks)
一.卷积卷积神经网络(Convolutional Neural Networks)是一种在空间上共享参数的神经网络.使用数层卷积,而不是数层的矩阵相乘.在图像的处理过程中,每一张图片都可以看成一张“ ...
ufldl学习笔记与编程作业：Multi-Layer Neural Network(多层神经网络+识别手写体编程)
ufldl学习笔记与编程作业:Multi-Layer Neural Network(多层神经网络+识别手写体编程) ufldl出了新教程,感觉比之前的好,从基础讲起,系统清晰,又有编程实践. 在dee ...
卷积神经网络用语句子分类---Convolutional Neural Networks for Sentence Classification 学习笔记
读了一篇文章,用到卷积神经网络的方法来进行文本分类,故写下一点自己的学习笔记: 本文在事先进行单词向量的学习的基础上,利用卷积神经网络(CNN)进行句子分类,然后通过微调学习任务特定的向量,提高性能. ...
神经风格转换Neural Style Transfer a review
原文:http://mp.weixin.qq.com/s/t_jknoYuyAM9fu6CI8OdNw 作者:Yongcheng Jing 等机器之心编译风格迁移是近来人工智能领域内的一个热门研究 ...
深度学习笔记之关于基本思想、浅层学习、Neural Network和训练过程（三）
不多说,直接上干货! 五.Deep Learning的基本思想假设我们有一个系统S,它有n层(S1,…Sn),它的输入是I,输出是O,形象地表示为: I =>S1=>S2=>….. ...
Neural Networks and Deep Learning(神经网络与深度学习) - 学习笔记
catalogue . 引言 . 感知器及激活函数 . 代价函数(loss function) . 用梯度下降法来学习-Learning with gradient descent . 用反向传播调整 ...

随机推荐

Redis学习记录(二)
1.Key命令设置key的过期时间. expire key second:设置key的过期时间 ttl key:查看key的有效期(如果显示正数说明该key正在倒计时,如果是-1说明该key永久保存 ...
HTML第四章：初始css
CSS样式: 一.为什么要使用CSS;可以让页面更美观.有利于开发速度. 二.什么是CSS:全称cascading style shee ...
Mysql 查询出某列字段被包含于条件数据中
我们通常是使用某条件是否包含于某列中 ,简单点就是:select * from 表名 where 字段名 like '%条件数据%'; 现在说下某列被包含于条件数据中接下 ...
Java读取各种文件格式内容
所需的jar包哦也不要太记得了,大家可以搜搜,直接上代码: import java.io.BufferedInputStream; import java.io.File; import java.i ...
第1 章初识Python
1.print()—输出 print()函数的基本用法如下: print(输出内容) 其中,输出内容可以是数字和字符串(使用引号括起来),此类内容将直接输出,也可以是包含运算符的表达式,此类内容将计算 ...
jupyter notebook（一）——anaconda安装后jupyter不能自动跳转网页
1.问题描述之前没有遇到过.这次重装系统,发现安装anaconda这个集成版python后,jupyter notebook打开后不能自动跳转打开的交互网页. 系统是windows7.anacond ...
JZOJ 5461. 【NOIP2017提高A组冲刺11.8】购物
5461. [NOIP2017提高A组冲刺11.8]购物 (File IO): input:shopping.in output:shopping.out Time Limits: 1000 ms ...
Paul Zindel【保罗·金代尔】
Paul Zindel Paul Zindel's death on March 27, 2003 ended the brilliant life of a famous write. 2003年3 ...
Java基础知识：Collection接口
*本文是最近学习到的知识的记录以及分享,算不上原创. *参考文献见文末. 这篇文章主要讲的是java的Collection接口派生的两个子接口List和Set. 目录 Collection框架 Lis ...
使用python实现简单爬虫
简单的爬虫架构调度器 URL管理器管理待抓取的URL集合和已抓取的URL,防止重复抓取,防止死循环功能列表 1:判断新添加URL是否在容器中 2:向管理器添加新URL 3:判断容器是否为空 4: ...

短文对话的神经反应机 -- Neural Responding Machine for Short-Text Conversation学习笔记

短文对话的神经反应机 -- Neural Responding Machine for Short-Text Conversation学习笔记的更多相关文章

随机推荐

热门专题