词嵌入 word embedding

embedding 嵌入

embedding: 嵌入, 在数学上表示一个映射f:x->y, 是将x所在的空间映射到y所在空间上去，并且在x空间中每一个x有y空间中唯一的y与其对应。嵌入，也就是把x在y空间中找到一个位置嵌入，一个x嵌入为一个唯一的y。

word embedding 词嵌入

也就是把当前预料文本库中每一个词语都嵌入到一个向量空间当中，并且每一个词语对应唯一的词向量，也就是词向量。

所以， one-hot也是word Embedding的一种实现，word2Vec也是为了实现 word embedding而提出的一种方案。

为什么要提出 word Embedding？

本质的想法是，把语料库中的每一个词语，映射成向量空间当中的唯一向量，这个向量在空间中的方向和位置能某种程度上衡量这个词的意思、感情色彩等。所以从传统的基于统计的n-gram模型之后，提出了one-hot模型，开始走向词向量，然后发现one-hot模型属于硬分类，只有词语不同和相同的信息，丢失了词义、不通词之间的词义，于是又提出了深度学习训练出的词向量模型，之后又经过改进，有了现在比较有名的word2vec模型。
word2vec模型本身其实是包含两种算法的模型，把语料库中的词语映射到向量空间，获得词向量的一种手段。

embedding层

初学nlp知识的时候，经常听到embedding层，一直不知道是什么意思。
我理解的embedding层，是一个全连接层。这个全连接层的参数，也就是一个矩阵。将词的one-hot编码与这个全连接层的系数矩阵相乘，得到了一个新的向量，这个向量就是词向量，这样一层全连接层被称作了embedding层，其实就是一个用于讲词映射为向量的映射矩阵。那么这样一个系数矩阵的参数，也就是embedding层这个全连接层的参数是怎么得到的，要详细学习一下word2vec模型里面的两个算法，说的直白点是在用深度学习对词做其他任务的时候，将第一层全连接层的系数保留了下来，也就是则个映射矩阵，也就是embedding层。

写在最后

具体word2vec模型是怎么样的，暂且不在这里细说。只是我再学习的过程中，绝大多数讲解中都讲wordEmbedding 和 word2vec混在一起说，也没说清楚什么是word embedding，看到有前辈讲的很清楚，我将自己的理解记录下来，以供他人参考。当然，我的理解可能是不对的，欢迎批评指正

词向量词嵌入 word embedding的更多相关文章

词袋模型（BOW，bag of words）和词向量模型（Word Embedding）概念介绍
例句: Jane wants to go to Shenzhen. Bob wants to go to Shanghai. 一.词袋模型将所有词语装进一个袋子里,不考虑其词法和语序的问题,即每个 ...
[DeeplearningAI笔记]序列模型2.1-2.2词嵌入word embedding
5.2自然语言处理觉得有用的话,欢迎一起讨论相互学习~Follow Me 2.1词汇表征 Word representation 原先都是使用词汇表来表示词汇,并且使用1-hot编码的方式来表示词汇 ...
DeepNLP的核心关键/NLP词的表示方法类型/NLP语言模型 /词的分布式表示/word embedding/word2vec
DeepNLP的核心关键/NLP语言模型 /word embedding/word2vec Indexing: 〇.序一.DeepNLP的核心关键:语言表示(Representation) 二.NL ...
学习笔记CB009:人工神经网络模型、手写数字识别、多层卷积网络、词向量、word2vec
人工神经网络,借鉴生物神经网络工作原理数学模型. 由n个输入特征得出与输入特征几乎相同的n个结果,训练隐藏层得到意想不到信息.信息检索领域,模型训练合理排序模型,输入特征,文档质量.文档点击历史.文档 ...
词向量(one-hot/SVD/NNLM/Word2Vec/GloVe)
目录词向量简介 1. 基于one-hot编码的词向量方法 2. 统计语言模型 3. 从分布式表征到SVD分解 3.1 分布式表征(Distribution) 3.2 奇异值分解(SVD) 3.3 基 ...
NLP教程(2) | GloVe及词向量的训练与评估
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/36 本文地址:http://www.showmeai.tech/article-det ...
词向量模型word2vector详解
目录前言 1.背景知识 1.1.词向量 1.2.one-hot模型 1.3.word2vec模型 1.3.1.单个单词到单个单词的例子 1.3.2.单个单词到单个单词的推导 2.CBOW模型 3.s ...
DNN模型训练词向量原理
转自:https://blog.csdn.net/fendouaini/article/details/79821852 1 词向量在NLP里,最细的粒度是词语,由词语再组成句子,段落,文章.所以处 ...
NLP直播-1 词向量与ELMo模型
翻车2次,试水2次,今天在B站终于成功直播了. 人气11万. 主要讲了语言模型.词向量的训练.ELMo模型(深度.双向的LSTM模型) 预训练与词向量词向量的常见训练方法深度学习与层次表示 LST ...

随机推荐

线性排序总结（c++实现）
前面介绍了一些常用的比较排序算法,它们都是通过比较两个元素的大小进行排序,归并排序和堆排序在最坏情况下的复杂度为O(nlgn),可以证明(使用决策树模型),通过比较进行排序,算法的下界为O(nlgn) ...
python 中根据python版本（2或3）定义函数
示意代码如下: #_*_coding:UTF-8_*_ import time import socket import os import sys if sys.version_info.major ...
php构建型模式(Builder pattern)
练代码,增加了调用时的输出. <?php /* The builder pattern separates the construction of a complex object from i ...
Linux学习23-Xftp上传文件显示乱码问题
前言当我们在windows新建一个文件,里面有中文时,使用Xftp上传到linux服务器上,会出现乱码问题. Windows的默认编码为GBK Linux的默认编码为UTF-8 Xftp上传文件乱码 ...
javascript学习3、数据类型、数据类型转换、运算符
数据类型包括:基本数据类型和引用数据类型基本数据类型指的是简单的数据段,引用数据类型指的是有多个值构成的对象. 当我们把变量赋值给一个变量时,解析器首先要确认的就是这个值是基本类型值还是引用类型值 ...
【HTTP】另类的POST头数据 RFC1867协议格式简析
http://blog.csdn.net/ai2000ai/article/details/52161979 昨天在实战表单模拟提交的时候,有发现在提交某个表单的时候,页面(discuz!论坛)报错, ...
bzoj1115&&POJ1704&&HDU4315——阶梯Nim
BZOJ1115 题意:阶梯Nim游戏大意:每个阶梯上有一堆石子,两个人在阶梯上玩推石子游戏.每人可以将某堆的任意多石子向左推一阶,所有的石子都推到阶梯下了即算成功,即不能推的输. 分析:根据阶梯Ni ...
linux mustache bash 实现mo 做为docker容器运行动态配置工具数组的处理
前面有说过关于使用mo 工具的简单配置使用,但是实际中我们可能存在比较复杂的数据处理,比如数组,mo 可以进行数组的处理,但是在测试的过程中,一直失败,查看了官方的demo以及帮助命令发现可以通过参数 ...
IIS服务器简单搭建
概况系统:WIN10企业版开发工具:VS2013 - VS2017 IIS版本:IIS6.0 安装安装步骤如图: 这里需要注意一点信息服务器下默认web管理工具只有iis控制台勾上了,也就意味 ...
fork，vfork
转自 http://blog.csdn.net/todd911/article/details/14062103 1.fork函数一个现有的进程可以调用fork函数创建一个新的子进程. #inclu ...

词向量 词嵌入 word embedding