Semantic Compositionality through Recursive Matrix-Vector Spaces

作者信息:
Richard Socher Brody Huval Christopher D. Manning Andrew Y. Ng
richard@socher.org, {brodyh,manning,ang}@stanford.edu
Computer Science Department, Stanford University
代码数据公开:
https://www.socher.org/index.php/Main/

MX-RNN模型:
We present a novel recursive neural network model for semantic compositionality. In our context,compositionality is the ability to learn compositional vector representations for various types of phrases and sentences of arbitrary length.
不需要任何hand-designed semantic resources比如WorNet,FrameNet
通过加入WordNet hypernyms, POS and NER tags性能更好

2 MV-RNN: A Recursive Matrix-Vector Model
之前多个词向量组合成一个短语或者句子是用的线性关系,但是只能捕捉‘sum’的关系,不能捕捉可以改变另外一个词的含义的词的功能,例如extremely strong
1)给每个词分配了一个向量和一个矩阵
2) learning an input-specific, nonlinear, compositional function for computing vector and matrix representations for multi-word sequences of any syntactic type
如果一个词缺少operator semantics,那么它的矩阵就是一个单位矩阵;然而,如果一个词主要是作为operator,比如extremely,那么它的向量会接近0,它的矩阵gain a clear operator meaning,正向和负向都会增大被修饰词的含义

2.2 Matrix-Vector Neural Word Representation
与训练词向量为50维,矩阵50*50维,初始化矩阵是单位矩阵+高斯噪声,所以每个句子表示为((单词向量1,单词矩阵1),。。。,(),())

2.2 composition models for two words
2010年的工作,用了表示句法关系的矩阵R,背景知识的矩阵K
我们的工作:u需要任何手工涉及的semantic resources比如背景知识K,也不需要explicit knownledge of relation R,使用输入independant的组合函数
W是n*2n,可以将输入的词统一到相同的维度,W可以捕捉compositional信息
得到的是p

2.3 Recursive Compositions of Multiple Words and Phrases
This section describes how we extend a word-pair matrix-vector-based compositional model to learn vectors and matrices for longer sequences of words
Wm
得到的是P

2.4 Objective Functions for Training
One of the advantages of RNN-based models is that each node of a tree has associated with it a distributed vector representation (the parent vector p) which can also be seen as features describing that
phrase.
softmax对节点p分类

2.5learning

2.6 Low-Rank Matrix Approximations

5 combination od semantic relationship
semantic relationships between pairs of nominals. For instance, in the sentence “My [apartment]e1 has a pretty large [kitchen]e2.”, we want to predict that the kitchen and apartment are in a component-whole relationship.
figure5分类名词关系:
1)先找到要分类的两个词
2)使用节点向量分类
数据是9个顺序关系(两个方向)*2+没有方向的一个 = 19类,比如因果,文本-主题

Semantic Compositionality through Recursive Matrix-Vector Spaces-paper的更多相关文章

  1. 论文翻译——Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank

    Abstract Semantic word spaces have been very useful but cannot express the meaning of longer phrases ...

  2. 向量空间(Vector Spaces)

    向量空间(Vector Spaces) 向量空间又称线性空间,是线性代数的中心内容和基本概念之一.在解析几何里引入向量的概念后,是许多问题的处理变得更为简洁和清晰,在此基础上的进一步抽象化,形成了与域 ...

  3. 语义SLAM的数据关联和语义定位(二)Semantic Localization Via the Matrix Permanent

    论文假设和单目标模型 这部分想讲一下Semantic Localization Via the Matrix Permanent这篇文章的一些假设. 待求解的问题可以描述为 假设从姿态\(x\)看到的 ...

  4. 【读书笔记】:MIT线性代数(2):Vector Spaces and Subspaces

    Vector Space: R1, R2, R3,R4 , .... Each space Rn consists of a whole collection of vectors. R5 conta ...

  5. Deep Learning for NLP 文章列举

    Deep Learning for NLP 文章列举 原文链接:http://www.xperseverance.net/blogs/2013/07/2124/   大部分文章来自: http://w ...

  6. 转 Deep Learning for NLP 文章列举

    原文链接:http://www.xperseverance.net/blogs/2013/07/2124/   大部分文章来自: http://www.socher.org/ http://deepl ...

  7. tree-lstm初探

    https://zhuanlan.zhihu.com/p/35252733 可以先看看上面知乎文章里面的例子 Socher 等人于2012和2013年分别提出了两种区分词或短语类型的模型,即SU-RN ...

  8. 【MT】牛津的MT教程

    Preamble This repository contains the lecture slides and course description for the Deep Natural Lan ...

  9. Saw a tweet from Andrew Liam Trask, sounds like Oxford DeepNLP 2017 class have all videos slides practicals all up. Thanks Andrew for the tip!

    Saw a tweet from Andrew Liam Trask, sounds like Oxford DeepNLP 2017 class have all videos/slides/pra ...

随机推荐

  1. jQuery实现淘宝轮播图

    我爱撸码,撸码使我感到快乐大家好,我是Counter今天给大家分享的是利用jQuery来实现淘宝轮播图,揭开这层神秘的面纱,CSS样式就不做过多的赘述了,主要就是实现的原理,也就是jQuery,老样子 ...

  2. luogu2046[NOI2010]海拔 对偶图优化

    luogu2046[NOI2010]海拔 对偶图优化 链接 https://www.luogu.org/problemnew/show/P2046 思路 海拔一定是0或者1,而且会有一条01交错的分界 ...

  3. 查找IDEA 项目中的依赖包存放在.m2位置

    原因:在maven项目pom.xml中添加依赖,可能由于网络不好,下载不完全,导致再次下载一直报错. 就会导致出现依赖一直报错.

  4. phpmyadmin-您可能正在上传很大的文件,请参考文档来寻找解决方法

    phpmyadmin-您可能正在上传很大的文件,请参考文档来寻找解决方法   实这个很简单的只要更改php.ini里三个配置即可.(见下面加粗部分,改成你自己的需求即可) ; Maximum allo ...

  5. vue 上传图片视频组件,可拍照选择照片,解决苹果手机拍照旋转问题

    1.创建组件components > uploadImg > index.vue <template> <input type="file" name ...

  6. linux中pam模块

    https://www.cnblogs.com/ilinuxer/p/5087447.html linux中pam模块 一.pam简介 Linux-PAM(linux可插入认证模块)是一套共享库,使本 ...

  7. 2015-10-19 sql1

        SQL SERVER(一) 一.设置登陆验证 1.右键点击数据库->属性->安全性设置密码登陆 2.数据库下找到安全性->登录名->sa,右键点击sa->属性(修 ...

  8. C++解析九-数据抽象

    数据抽象 数据抽象是指,只向外界提供关键信息,并隐藏其后台的实现细节,即只表现必要的信息而不呈现细节.数据抽象是一种依赖于接口和实现分离的编程(设计)技术.让我们举一个现实生活中的真实例子,比如一台电 ...

  9. exadata cellcli

    cellcli [port_number] [-n] [-m] [-xml] [-v | -vv | -vvv] [-x] [-e command] The following table lists ...

  10. java变量的作用域和基本数据类型转换

    1.变量的作用域 赋值运算符 变量名 = 表达式 列: a = (b+3)+(b-1) 表达式就是符号(如:加号,减号)与操作数(如:b,3)的组合 自动类型转换(隐式类型转换):从小类型到大类型可以 ...