Semantic Compositionality through Recursive Matrix-Vector Spaces-paper
Semantic Compositionality through Recursive Matrix-Vector Spaces
作者信息:
Richard Socher Brody Huval Christopher D. Manning Andrew Y. Ng
richard@socher.org, {brodyh,manning,ang}@stanford.edu
Computer Science Department, Stanford University
代码数据公开:
https://www.socher.org/index.php/Main/
MX-RNN模型:
We present a novel recursive neural network model for semantic compositionality. In our context,compositionality is the ability to learn compositional vector representations for various types of phrases and sentences of arbitrary length.
不需要任何hand-designed semantic resources比如WorNet,FrameNet
通过加入WordNet hypernyms, POS and NER tags性能更好
2 MV-RNN: A Recursive Matrix-Vector Model
之前多个词向量组合成一个短语或者句子是用的线性关系,但是只能捕捉‘sum’的关系,不能捕捉可以改变另外一个词的含义的词的功能,例如extremely strong
1)给每个词分配了一个向量和一个矩阵
2) learning an input-specific, nonlinear, compositional function for computing vector and matrix representations for multi-word sequences of any syntactic type
如果一个词缺少operator semantics,那么它的矩阵就是一个单位矩阵;然而,如果一个词主要是作为operator,比如extremely,那么它的向量会接近0,它的矩阵gain a clear operator meaning,正向和负向都会增大被修饰词的含义
2.2 Matrix-Vector Neural Word Representation
与训练词向量为50维,矩阵50*50维,初始化矩阵是单位矩阵+高斯噪声,所以每个句子表示为((单词向量1,单词矩阵1),。。。,(),())
2.2 composition models for two words
2010年的工作,用了表示句法关系的矩阵R,背景知识的矩阵K
我们的工作:u需要任何手工涉及的semantic resources比如背景知识K,也不需要explicit knownledge of relation R,使用输入independant的组合函数
W是n*2n,可以将输入的词统一到相同的维度,W可以捕捉compositional信息
得到的是p
2.3 Recursive Compositions of Multiple Words and Phrases
This section describes how we extend a word-pair matrix-vector-based compositional model to learn vectors and matrices for longer sequences of words
Wm
得到的是P
2.4 Objective Functions for Training
One of the advantages of RNN-based models is that each node of a tree has associated with it a distributed vector representation (the parent vector p) which can also be seen as features describing that
phrase.
softmax对节点p分类
2.5learning
2.6 Low-Rank Matrix Approximations
5 combination od semantic relationship
semantic relationships between pairs of nominals. For instance, in the sentence “My [apartment]e1 has a pretty large [kitchen]e2.”, we want to predict that the kitchen and apartment are in a component-whole relationship.
figure5分类名词关系:
1)先找到要分类的两个词
2)使用节点向量分类
数据是9个顺序关系(两个方向)*2+没有方向的一个 = 19类,比如因果,文本-主题
Semantic Compositionality through Recursive Matrix-Vector Spaces-paper的更多相关文章
- 论文翻译——Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank
Abstract Semantic word spaces have been very useful but cannot express the meaning of longer phrases ...
- 向量空间(Vector Spaces)
向量空间(Vector Spaces) 向量空间又称线性空间,是线性代数的中心内容和基本概念之一.在解析几何里引入向量的概念后,是许多问题的处理变得更为简洁和清晰,在此基础上的进一步抽象化,形成了与域 ...
- 语义SLAM的数据关联和语义定位(二)Semantic Localization Via the Matrix Permanent
论文假设和单目标模型 这部分想讲一下Semantic Localization Via the Matrix Permanent这篇文章的一些假设. 待求解的问题可以描述为 假设从姿态\(x\)看到的 ...
- 【读书笔记】:MIT线性代数(2):Vector Spaces and Subspaces
Vector Space: R1, R2, R3,R4 , .... Each space Rn consists of a whole collection of vectors. R5 conta ...
- Deep Learning for NLP 文章列举
Deep Learning for NLP 文章列举 原文链接:http://www.xperseverance.net/blogs/2013/07/2124/ 大部分文章来自: http://w ...
- 转 Deep Learning for NLP 文章列举
原文链接:http://www.xperseverance.net/blogs/2013/07/2124/ 大部分文章来自: http://www.socher.org/ http://deepl ...
- tree-lstm初探
https://zhuanlan.zhihu.com/p/35252733 可以先看看上面知乎文章里面的例子 Socher 等人于2012和2013年分别提出了两种区分词或短语类型的模型,即SU-RN ...
- 【MT】牛津的MT教程
Preamble This repository contains the lecture slides and course description for the Deep Natural Lan ...
- Saw a tweet from Andrew Liam Trask, sounds like Oxford DeepNLP 2017 class have all videos slides practicals all up. Thanks Andrew for the tip!
Saw a tweet from Andrew Liam Trask, sounds like Oxford DeepNLP 2017 class have all videos/slides/pra ...
随机推荐
- C++读写图片数据转成Base64格式的一种方法
最近在一个项目中要实现在客户端和服务端之间传送图片文件的功能,采用了C++语言读写图片转化成Base64格式进行传输.具体代码如下: //++Base64.h #pragma once class C ...
- Delphi10.2 Tokyo试用(1)
最近下载了Delphi10.2 Tokyo,试用了一下,感觉不错,尤其是针对Linux的开发,总算出来了,可以考虑把原来服务器重新编译成RedHat上使用了,免得客户一天到晚喊Windows不安全,要 ...
- JS(JavaScript)的初了解4(更新中···)
1.JS的本质就是处理数据.数据来自于后台的数据库. 所以变量就起到一个临时存储数据的作用. ECMAScript制定了JS的数据类型. 数据类型有哪些? 字符串 String 数字 Num ...
- parquet 简介
原文 Parquet 列式存储格式 面向分析型业务的列式存储格式 由 Twitter 和 Cloudera 合作开发,2015 年 5 月从 Apache 的孵化器里毕业成为 Apache 顶级项目 ...
- vue进行文件下载
本文为博主原创,未经允许不得转载: 总结一下,最近在vue中实现一个文件下载的功能,用了vue中ajax的方式请求下载接口, 但是返回报错,在网上查询之后,找到用ajax请求下载文件报错的原因:aja ...
- 补充一下 sizeof
sizeof是一个运算符,给出某个类型或变量在内存中所占据的字节数 sizeof(int) //告诉你int占据几个字节 sizeof(i) //告诉你i这个变量占据几个字节 注:sizeof是静态运 ...
- 使用scss为css样式自动添加浏览器前缀
当一个浏览器实现一个新的属性.值或者选择器,而这个特征还不是处于候选推荐标准状态的时候,这属性的前面会添加一个前缀以便于它的渲染引擎识别. 浏览器使用前缀来尝试一些新属性.值和选择器,即使他们还没有最 ...
- L0 Regularization
参考: Learning Sparse Neural Networks through L0 Regularization The Variational Garrote
- 『Python CoolBook』数据结构和算法_字典比较&字典和集合
一.字典元素排序 dict.keys(),dict.values(),dict.items() 结合max.min.sorted.zip进行排序是个很好的办法,另外注意不使用zip时,字典的lambd ...
- prometheus告警配置注意事项
global: scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minut ...