在了解什么是嵌入(embeddings)之前,我们需要先搞清楚一个词语在NLP中是如何被表示的 注:本次不涉及任何具体算法,只是单纯对概念的理解 词汇表征 One-Hot 词汇的表示方法有很多,最有名的肯定是独热编码(One-Hot )了.因为不是重点,所以下面只简单介绍一下 废话不多说,上图! 假设我们有10000个词,Man位于第5391个,Woman位于9853,如果想要唯一表示这些词怎么办? 我们可以根据词的总量创建一个n行一列的矩阵,在某个词出现的地方标注为1,其余都用0填充,这样就可…