Semantic Compositionality through Recursive Matrix-Vector Spaces

作者信息:
Richard Socher Brody Huval Christopher D. Manning Andrew Y. Ng
richard@socher.org, {brodyh,manning,ang}@stanford.edu
Computer Science Department, Stanford University
代码数据公开:
https://www.socher.org/index.php/Main/

MX-RNN模型:
We present a novel recursive neural network model for semantic compositionality. In our context,compositionality is the ability to learn compositional vector representations for various types of phrases and sentences of arbitrary length.
不需要任何hand-designed semantic resources比如WorNet,FrameNet
通过加入WordNet hypernyms, POS and NER tags性能更好

2 MV-RNN: A Recursive Matrix-Vector Model
之前多个词向量组合成一个短语或者句子是用的线性关系,但是只能捕捉‘sum’的关系,不能捕捉可以改变另外一个词的含义的词的功能,例如extremely strong
1)给每个词分配了一个向量和一个矩阵
2) learning an input-specific, nonlinear, compositional function for computing vector and matrix representations for multi-word sequences of any syntactic type
如果一个词缺少operator semantics,那么它的矩阵就是一个单位矩阵;然而,如果一个词主要是作为operator,比如extremely,那么它的向量会接近0,它的矩阵gain a clear operator meaning,正向和负向都会增大被修饰词的含义

2.2 Matrix-Vector Neural Word Representation
与训练词向量为50维,矩阵50*50维,初始化矩阵是单位矩阵+高斯噪声,所以每个句子表示为((单词向量1,单词矩阵1),。。。,(),())

2.2 composition models for two words
2010年的工作,用了表示句法关系的矩阵R,背景知识的矩阵K
我们的工作:u需要任何手工涉及的semantic resources比如背景知识K,也不需要explicit knownledge of relation R,使用输入independant的组合函数
W是n*2n,可以将输入的词统一到相同的维度,W可以捕捉compositional信息
得到的是p

2.3 Recursive Compositions of Multiple Words and Phrases
This section describes how we extend a word-pair matrix-vector-based compositional model to learn vectors and matrices for longer sequences of words
Wm
得到的是P

2.4 Objective Functions for Training
One of the advantages of RNN-based models is that each node of a tree has associated with it a distributed vector representation (the parent vector p) which can also be seen as features describing that
phrase.
softmax对节点p分类

2.5learning

2.6 Low-Rank Matrix Approximations

5 combination od semantic relationship
semantic relationships between pairs of nominals. For instance, in the sentence “My [apartment]e1 has a pretty large [kitchen]e2.”, we want to predict that the kitchen and apartment are in a component-whole relationship.
figure5分类名词关系:
1)先找到要分类的两个词
2)使用节点向量分类
数据是9个顺序关系(两个方向)*2+没有方向的一个 = 19类,比如因果,文本-主题

Semantic Compositionality through Recursive Matrix-Vector Spaces-paper的更多相关文章

  1. 论文翻译——Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank

    Abstract Semantic word spaces have been very useful but cannot express the meaning of longer phrases ...

  2. 向量空间(Vector Spaces)

    向量空间(Vector Spaces) 向量空间又称线性空间,是线性代数的中心内容和基本概念之一.在解析几何里引入向量的概念后,是许多问题的处理变得更为简洁和清晰,在此基础上的进一步抽象化,形成了与域 ...

  3. 语义SLAM的数据关联和语义定位(二)Semantic Localization Via the Matrix Permanent

    论文假设和单目标模型 这部分想讲一下Semantic Localization Via the Matrix Permanent这篇文章的一些假设. 待求解的问题可以描述为 假设从姿态\(x\)看到的 ...

  4. 【读书笔记】:MIT线性代数(2):Vector Spaces and Subspaces

    Vector Space: R1, R2, R3,R4 , .... Each space Rn consists of a whole collection of vectors. R5 conta ...

  5. Deep Learning for NLP 文章列举

    Deep Learning for NLP 文章列举 原文链接:http://www.xperseverance.net/blogs/2013/07/2124/   大部分文章来自: http://w ...

  6. 转 Deep Learning for NLP 文章列举

    原文链接:http://www.xperseverance.net/blogs/2013/07/2124/   大部分文章来自: http://www.socher.org/ http://deepl ...

  7. tree-lstm初探

    https://zhuanlan.zhihu.com/p/35252733 可以先看看上面知乎文章里面的例子 Socher 等人于2012和2013年分别提出了两种区分词或短语类型的模型,即SU-RN ...

  8. 【MT】牛津的MT教程

    Preamble This repository contains the lecture slides and course description for the Deep Natural Lan ...

  9. Saw a tweet from Andrew Liam Trask, sounds like Oxford DeepNLP 2017 class have all videos slides practicals all up. Thanks Andrew for the tip!

    Saw a tweet from Andrew Liam Trask, sounds like Oxford DeepNLP 2017 class have all videos/slides/pra ...

随机推荐

  1. 改写element-ui中的日期组件

    如果你想实现一个自定义的日期组件规则如下:日期组件未点开前左右两边有前一天后一天控制箭头,且前一天后一天有数据时才显示箭头,没有数据时,快速切换箭头隐藏.当日期组件点开后,有数据的天为可点击状态,无数 ...

  2. 移动Web UI库(H5框架)

    1.Framework7 Framework7 - is a free and open source mobile HTML framework to develop hybrid mobile a ...

  3. ES6标准之基础

    let和const命令 ES6新增let命令,用于声明变量,是块级作用域. let声明的变量不会像var声明的变量发生“变量提升”现象,所以,变量一定要在声明后使用,不然就会报错. 暂时性死区:只要块 ...

  4. iconfont作用在css伪类中的写法

    iconfont作用在css伪类中需要注意两点: 1.字体声明(font-family: "iconfont";). 2.把字体写成十六进制的Unicode编码.比如:" ...

  5. 盛最多水的容器(java实现)

    题目: 给定 n 个非负整数 a1,a2,...,an,每个数代表坐标中的一个点 (i, ai) .在坐标内画 n 条垂直线,垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0).找出其中的 ...

  6. double 类型转化为Integer

    (1)把double先转化成int类型 Double reseve3=Double.parseDouble(bddet[0].getReserve3()); int b=reseve3.intValu ...

  7. laravel数据库迁移 和 路由防攻击

    命令:php  artisan  migrate 防攻击:

  8. TCP建立连接为什么是三次握手,为什么不是两次或四次?

    什么是三次握手 学过网络编程的人,应该都知道TCP建立连接的三次握手,下面简单描述一下这个过程. 如图所示 第一次握手:客户端发送TCP包,置SYN标志位为1,将初始序号X,保存在包头的序列号(Seq ...

  9. Cassandra.yaml 配置详解

    cluster_name 设置Cassandra集群的名称. 在Cassandra集群中,每一台服务器都必须具备相应的集群的名称.如果名称不一致,则当前Cassandra服务器无法加入集群. init ...

  10. python3练习-查找文件

    题: 编写一个程序,能在当前目录以及当前目录的所有子目录下查找文件名包含指定字符串的文件,并打印出相对路径 import os import os.path def find_file(root,pa ...