embedding models 是一类机器学习模型,它们的核心功能是将高维、离散的输入数据(如词汇、类别标签、节点或实体)映射到低维、连续的向量空间中。

这些向量(即 embeddings)通常具有丰富的语义信息,并能够捕捉原始数据之间的潜在关系和相似度。以下是对 embedding models 的详细说明:

1.目的与应用场景:

降维与表征学习:Embedding models 主要用于学习从原始数据到低维向量的有效映射,降低数据维度,便于后续计算和分析。这些低维向量保留了原始数据的关键特征和结构信息。

自然语言处理 (NLP):在 NLP 中,最经典的 embedding model 是词嵌入(Word Embeddings),如 Word2Vec、GloVe 和 FastText,它们将词语映射到实数向量,使得语义相近的词在向量空间中距离较近,用于文本分类、情感分析、机器翻译等任务。

推荐系统:用户和物品的嵌入模型用于捕获用户兴趣和物品属性的相似性,常用于个性化推荐、协同过滤等场景。

知识图谱:实体和关系嵌入(如 TransE、DistMult、RotatE)将知识图谱中的节点和边表示为向量,用于链接预测、实体对齐、推理等任务。

计算机视觉:图像特征嵌入用于提取图像的紧凑表示,用于图像检索、相似性比较、分类等任务。

2.学习方法:

无监督学习:许多早期的 embedding models 采用无监督学习方式,如基于神经网络的语言模型(Word2Vec的CBOW和Skip-gram模型)或全局词频统计(GloVe),通过最大化词语上下文的预测准确性或捕获全局共现信息来学习词嵌入。

有监督学习:在特定任务(如情感分析、命名实体识别)上训练的深度学习模型(如 BERT、ELMo、GPT),其词嵌入层作为预训练模型的一部分,可在下游任务中微调,实现有监督的embedding学习。

自监督学习:近期的一些模型(如 SimCLR、Momentum Contrastive Learning)利用数据增强和对比学习策略在无标签数据上学习高质量的图像或文本嵌入。

3.模型架构与训练:

神经网络架构:embedding models 常基于简单的前馈神经网络(如 Word2Vec)、复杂深度神经网络(如 BERT)或专门设计的图神经网络(如 GraphSAGE、Graph Attention Network)。

损失函数:根据学习目标,可能使用负采样损失(如 Word2Vec)、最大似然估计(如 GloVe)、三元组损失(如知识图谱嵌入)、对比学习损失(如 SimCLR)等。

训练数据:可以是纯文本语料库、用户-物品交互记录、知识图谱数据、图像数据集等。

4.应用与使用:

直接使用预训练模型:在很多情况下,可以直接使用已训练好的、针对通用任务的 embedding 模型,如使用预训练的 Word2Vec 或 GloVe 向量作为文本特征。

微调或适应特定领域:根据实际需求,可以在特定领域数据上对预训练模型进行微调,或者使用迁移学习策略调整现有模型以适应新的语境或任务。

嵌入向量操作:在下游任务中,嵌入向量可以进行加法、减法、点积、余弦相似度计算等操作,以利用其表征的语义信息。

总之,embedding models 是一种广泛应用于各类机器学习任务的技术,通过将复杂、离散的数据转化为低维、连续的向量表示,有效地捕捉数据间的语义关系,提升模型性能和泛化能力。这些模型在 NLP、推荐系统、知识图谱推理、计算机视觉等领域均有广泛应用。

AI 新世代

Online Tool

Link:https://www.cnblogs.com/farwish/p/18127206

embedding models 是什么的更多相关文章

  1. 论文阅读 Predicting Dynamic Embedding Trajectory in Temporal Interaction Networks

    6 Predicting Dynamic Embedding Trajectory in Temporal Interaction Networks link:https://arxiv.org/ab ...

  2. 全网最详细中英文ChatGPT接口文档(四)30分钟快速入门ChatGPT——Models模型

    @ 目录 Models Overview 概述 GPT-4 Limited beta GPT-3.5 Feature-specific models 特定功能的模型 Finding the right ...

  3. 翻译 | Improving Distributional Similarity with Lessons Learned from Word Embeddings

    翻译 | Improving Distributional Similarity with Lessons Learned from Word Embeddings 叶娜老师说:"读懂论文的 ...

  4. (转)Extracting knowledge from knowledge graphs using Facebook Pytorch BigGraph.

    Extracting knowledge from knowledge graphs using Facebook Pytorch BigGraph 2019-04-27 09:33:58 This ...

  5. 【NLP】How to Generate Embeddings?

    How to represent words. 0 . Native represtation: one-hot vectors Demision: |all words| (too large an ...

  6. [转]NLP Tasks

    Natural Language Processing Tasks and Selected References I've been working on several natural langu ...

  7. ICLR 2013 International Conference on Learning Representations深度学习论文papers

    ICLR 2013 International Conference on Learning Representations May 02 - 04, 2013, Scottsdale, Arizon ...

  8. IJCAI 2019 Analysis

    IJCAI 2019 Analysis 检索不到论文的关键词:retrofitting word embedding Getting in Shape: Word Embedding SubSpace ...

  9. basic deepwalk

    Get to know How deepwalk works by this project. Two steps: 1. gen the graph, and gen the corpus on t ...

  10. [CVPR2017] Visual Translation Embedding Network for Visual Relation Detection 论文笔记

    http://www.ee.columbia.edu/ln/dvmm/publications/17/zhang2017visual.pdf Visual Translation Embedding ...

随机推荐

  1. 深入分析Java中的PriorityQueue底层实现与源码

    本文分享自华为云社区<滚雪球学Java(70):深入理解Java中的PriorityQueue底层实现与源码分析>,作者: bug菌. 环境说明:Windows 10 + IntelliJ ...

  2. 浅析三维模型OBJ格式轻量化压缩集群处理方法

    浅析三维模型OBJ格式轻量化压缩集群处理方法 三维模型的OBJ格式轻量化压缩是指通过一系列技术和方法将三维模型的文件大小进一步减小,以提高模型在计算机中的加载.传输和存储效率.集群处理技术是指利用多台 ...

  3. mybatis案例程序

    前置工作 导包(mysql-connector-java.mybatis) 实体类 Mapper层 1.接口 public interface BookMapper { public Book get ...

  4. 工具推荐-personal kanban

    工具推荐 -- personal kanban 看板工具 在项目中接触到项目管理工具pingcode中含有看板工具 但是实际使用时一般一周才看一下项目进度 这个看板的参与度实际上很低 为了将日常的工作 ...

  5. CornerNet-Lite:CornerNet粗暴优化,加速6倍还提点了 | BMVC 2020

    论文对CornerNet进行了性能优化,提出了CornerNet-Saccade和CornerNet-Squeeze两个优化的CornerNet变种,优化的手段具有很高的针对性和局限性,不过依然有很多 ...

  6. 【已解决】IDEA项目启动时Maven报错:Downgrade Maven to version 3.8.1 or earlier in settings

    报错场景如下: Possible solutions: Check that Maven pom files not contain http repository http://mvn.gt.ige ...

  7. 基于IDEA javaweb项目目录结构

    https://www.pianshen.com/article/62631355687/

  8. 汇编语言-使用BIOS进行键盘输入和磁盘读写

    int9中断例程对键盘输入的处理   键盘输入将引发9号中断,BIOS提供了int9中断例程.CPU在9号中断发生后,执行int 9中断例程,从60h端口读出扫描码,并将其转化为相应的ASCII码或状 ...

  9. OpenHarmony中的HDF单链表及其迭代器

    概念 为了性能考虑,嵌入式系统一般使用C语言进行开发,由于C语言标准库没有封装链表,所以嵌入式系统一般自己设计和实现链表这种数据结构.单链表是链表中的一种,本文描述OpenAtom OpenHarmo ...

  10. SQL 算术运算符:加法、减法、乘法、除法和取模的用法

    SQL Server中的存储过程 什么是存储过程? 存储过程是一段预先编写好的 SQL 代码,可以保存在数据库中以供反复使用.它允许将一系列 SQL 语句组合成一个逻辑单元,并为其分配一个名称,以便在 ...