NLP+2vec︱认识多种多样的2vec向量化模型
1、word2vec
耳熟能详的NLP向量化模型。
Paper: https://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf
Java: http://deeplearning4j.org/word2vec
C++: https://github.com/jdeng/word2vec
Python:
https://radimrehurek.com/gensim/models/word2vec.html
https://github.com/danielfrg/word2vec
2、doc2vec
Paper: https://cs.stanford.edu/~quocle/paragraph_vector.pdf
Python: https://radimrehurek.com/gensim/models/doc2vec.html
word2vec模型对词向量进行平均处理,我们仍然忽略了单词之间的排列顺序对情感分析的影响。即上述的word2vec只是基于词的维度进行”语义分析”的,而并不具有上下文的”语义分析”能力。
作为一个处理可变长度文本的总结性方法,Quoc Le 和 Tomas Mikolov 提出了 Doc2Vec方法。除了增加一个段落向量以外,这个方法几乎等同于 Word2Vec。和 Word2Vec 一样,该模型也存在两种方法:Distributed Memory(DM) 和 Distributed Bag of Words(DBOW)。DM 试图在给定上下文和段落向量的情况下预测单词的概率。在一个句子或者文档的训练过程中,段落 ID 保持不变,共享着同一个段落向量。DBOW 则在仅给定段落向量的情况下预测段落中一组随机单词的概率。
(参考:Algorithm & NLP] 文本深度表示模型——word2vec&doc2vec词向量模型 )
3、tweet2vec
Paper: https://arxiv.org/abs/1605.03481
Python: https://github.com/bdhingra/tweet2vec
一些社交文本中的语言结构跟书面语大不相同,所以作者别出心裁的特意做了一个基于字符组合的模型,其可以基于整个微博环境下复杂、非正常语言的字符串中学习到一种向量化的表达方式。
4、batter-pitcher-2vec
Python: https://github.com/airalcorn2/batter-pitcher-2vec
5、illustration-2vec
Python: https://github.com/rezoo/illustration2vec
6、lda2vec
Paper: https://arxiv.org/pdf/1605.02019v1.pdf
Python: https://github.com/cemoody/lda2vec
将LDA与word2vec相结合,LDA是我比较在意的研究方向,这个模型很早提出,不过应用地倒是不多。
lda2vec the topics can be ‘supervised’ and forced to predict another target.
7、sentence2vec
Python: https://github.com/klb3713/sentence2vec
8、wiki2vec
Java/Scala: https://github.com/idio/wiki2vec
9、topicvec
Paper: http://bigml.cs.tsinghua.edu.cn/~jun/topic-embedding.pdf
Python: https://github.com/askerlee/topicvec
10、entity2vec
Python: https://github.com/ot/entity2vec
Paper: http://www.di.unipi.it/~ottavian/files/wsdm15_fel.pdf
11、str2vec
Python: https://github.com/pengli09/str2vec
12、node2vec
Paper: https://arxiv.org/abs/1607.00653
Page: https://snap.stanford.edu/node2vec/
Python: https://github.com/aditya-grover/node2vec
可见:笔记︱基于网络节点的node2vec、论文、算法python实现
13、item2vec
Paper: https://arxiv.org/abs/1603.04259
14、author2vec
15、playlist-to-vec
Python: https://github.com/mattdennewitz/playlist-to-vec
16、sense2vec
Paper: https://arxiv.org/abs/1511.06388
17、med2vec
Paper: https://arxiv.org/abs/1602.05568
Python: https://github.com/mp2893/med2vec
SCODE Word Embeddings using Substitute Words
Python: https://github.com/ai-ku/wvec
18、game2vec
Python: https://github.com/warchildmd/game2vec
19、paper2vec
Paper: https://arxiv.org/pdf/1703.06587.pdf
转自:http://blog.csdn.net/sinat_26917383/article/details/69666596
NLP+2vec︱认识多种多样的2vec向量化模型的更多相关文章
- NLP学习(2)----文本分类模型
实战:https://github.com/jiangxinyang227/NLP-Project 一.简介: 1.传统的文本分类方法:[人工特征工程+浅层分类模型] (1)文本预处理: ①(中文) ...
- 自然语言处理NLP学习笔记一:概念与模型初探
前言 先来看一些demo,来一些直观的了解. 自然语言处理: 可以做中文分词,词性分析,文本摘要等,为后面的知识图谱做准备. http://xiaosi.trs.cn/demo/rs/demo 知识图 ...
- 【NLP】揭秘马尔可夫模型神秘面纱系列文章(一)
初识马尔可夫和马尔可夫链 作者:白宁超 2016年7月10日20:34:20 摘要:最早接触马尔可夫模型的定义源于吴军先生<数学之美>一书,起初觉得深奥难懂且无什么用场.直到学习自然语言处 ...
- 【NLP】揭秘马尔可夫模型神秘面纱系列文章(二)
马尔可夫模型与隐马尔可夫模型 作者:白宁超 2016年7月11日15:31:11 摘要:最早接触马尔可夫模型的定义源于吴军先生<数学之美>一书,起初觉得深奥难懂且无什么用场.直到学习自然语 ...
- 【NLP】揭秘马尔可夫模型神秘面纱系列文章(三)
向前算法解决隐马尔可夫模型似然度问题 作者:白宁超 2016年7月11日22:54:57 摘要:最早接触马尔可夫模型的定义源于吴军先生<数学之美>一书,起初觉得深奥难懂且无什么用场.直到学 ...
- 【NLP】揭秘马尔可夫模型神秘面纱系列文章(四)
维特比算法解决隐马尔可夫模型解码问题(中文句法标注) 作者:白宁超 2016年7月12日14:08:28 摘要:最早接触马尔可夫模型的定义源于吴军先生<数学之美>一书,起初觉得深奥难懂且无 ...
- 【NLP】揭秘马尔可夫模型神秘面纱系列文章(五)
向前向后算法解决隐马尔可夫模型机器学习问题 作者:白宁超 2016年7月12日14:28:10 摘要:最早接触马尔可夫模型的定义源于吴军先生<数学之美>一书,起初觉得深奥难懂且无什么用场. ...
- NLP直播-1 词向量与ELMo模型
翻车2次,试水2次,今天在B站终于成功直播了. 人气11万. 主要讲了语言模型.词向量的训练.ELMo模型(深度.双向的LSTM模型) 预训练与词向量 词向量的常见训练方法 深度学习与层次表示 LST ...
- TF-IDF与主题模型 - NLP学习(3-2)
分词(Tokenization) - NLP学习(1) N-grams模型.停顿词(stopwords)和标准化处理 - NLP学习(2) 文本向量化及词袋模型 - NLP学习(3-1) 在上一篇博文 ...
随机推荐
- Spring MVC(二)--Spring MVC登陆实例
本文通过一个简单的登陆实例实现Spring MVC的流程,同时整合 MyBatis使用,流程是这样的: 1.访问一个URL进入登陆界面 2.输入正确的用户名和密码,成功则进入index页面,否则留在登 ...
- 原生JS与JQ获取元素的区别
刚学JQ不久,有时候可能会把JS和JQ获取元素的方式搞错,接下来获取属性方法什么的就一发不可收拾了,现在把两者获取获取元素的代码整理下. 一.原生JS获取元素. 1.常用的三种方式获取元素对象(将指定 ...
- VS2015使用Nuget安装OpenCV3.X以及Python3安装OpenCV3.X
VS2015已经自带Nuget安装工具了,所以,新建一个项目,点击管理Nuget包 搜索OpenCV3 注意,目前只有这个版本支持VS2015,也就是平台工具集可以为vs140,其他的都会报错,报错我 ...
- HYSBZ 1015/BZOJ1015 星球大战starwar
Description 很久以前,在一个遥远的星系,一个黑暗的帝国靠着它的超级武器统治者整个星系.某一天,凭着一个偶然的机遇,一支反抗军摧毁了帝国的超级武器,并攻下了星系中几乎所有的星球.这些星球通过 ...
- loj6046 「雅礼集训 2017 Day8」爷
https://loj.ac/problem/6046 最近遇到几个分块题,我发现我一遇到分块题就死活构造不出来 不对,明明是,遇到数据结构题,就死活构造不出来. 所以我就找了几个分块题做做. 其实分 ...
- bzoj月赛1805
题目在最后,FG还不会做,等着$NicoDafaGood$和$Achen$给我讲 A 对于每一个质因子建一棵线段树,直接查询就好了 主要是看到所有数的大小都不是很大,然后质因子最多只有log个,复杂度 ...
- 20190716-T3-奇袭
我要嗝了 我经过一系列努力,寻找了一系列,各种复杂度的方法. 1>纯暴力 复杂度:$\Theta(N^5)$ 不多解释,上代码: 空间复杂度无法承受,如果考试偏要写这个不妨动态开数组: 例: # ...
- jQuery 源码解析(二十九) 样式操作模块 尺寸详解
样式操作模块可用于管理DOM元素的样式.坐标和尺寸,本节讲解一下尺寸这一块 jQuery通过样式操作模块里的尺寸相关的API可以很方便的获取一个元素的宽度.高度,而且可以很方便的区分padding.b ...
- idea目录结构子目录在父目录后面跟着改成树形结构
1.点击项目窗口的设置按钮 2.取消Compact Middle Packages选项的对勾即可
- Spring Boot邮件功能
1.应用场景 邮件功能的应用场景可谓十分广泛,诸如注册用户.密码找回,消息通知.以及一些程序异常通知等都需要使用到该功能. 正是由于邮件功能的使用广泛,因此springboot也加在它的组件中添加了邮 ...