SOTA (State-of-the-Art)

  在深度学习领域,SOTA指的是“当前最高技术水平”或“最佳实践”。它用来形容在特定任务或领域中性能最优的模型或方法。随着研究进展,SOTA会不断被新的研究成果所超越。

非端到端模型

  非端到端模型指的是模型架构中包含多个分离的组件或步骤,每个部分可能独立训练或优化,最终通过组合这些部分的输出来得到最终结果。与端到端模型相比,非端到端模型的各部分可能需要更多的手工设计和调整。

端到端模型

  端到端模型强调从输入到输出的直接映射,无需中间的人工设计特征或步骤。整个模型作为一个整体进行训练,使得模型能够自动学习到输入到输出的最佳转换,简化了模型结构,往往能更好地捕捉数据中的复杂关系。

迁移学习

  迁移学习是指将一个任务上训练好的模型的知识应用到另一个相关但不同的任务上,以减少新任务所需的训练数据量和时间。这可以是通过微调预训练模型实现,或是直接利用模型的特征表示。

微调

  微调是迁移学习的一种常用策略,指的是在预训练模型的基础上,针对特定下游任务进行进一步的训练,仅更新部分或全部层的权重,以适应新任务的特定需求。

监督学习

  监督学习是一种机器学习方法,其中模型在带有标签的训练数据上进行学习。目标是学习一个映射函数,将输入数据映射到正确的输出标签。常见的监督学习任务包括分类和回归。

非监督学习

  非监督学习是指在没有明确标签的输入数据上进行学习,目的是发现数据中的结构、模式或潜在特征。典型任务包括聚类和降维。

半监督学习

  半监督学习结合了监督学习和非监督学习,使用既有标签又有未标签的数据进行训练。其目的是利用未标签数据增强模型的泛化能力,减少对昂贵的标注数据的依赖。

泛化(Generalization)

  泛化能力是指模型在未见过的数据上的表现,即模型能否将学到的规律应用于新情况。良好的泛化是机器学习追求的目标,避免过拟合是提升泛化能力的关键。

正则化(Regularization)

  正则化是防止模型过拟合的技术,通过向损失函数中添加惩罚项来限制模型复杂度。常见的正则化方法有L1正则化(促进稀疏解)和L2正则化(减小权重值)。

吞吐量

  在深度学习中,吞吐量通常指的是模型每秒处理数据(如图像、文本)的能力,是衡量模型效率和系统性能的重要指标。

大模型

  大模型指的是参数量巨大的深度学习模型,如数亿至数千亿参数。这些模型因其规模而具有强大的表达能力,能够学习到更复杂的特征和关系,但也需要大量数据和计算资源来训练。

指令微调、增量微调

  指令微调:针对特定指令或任务的微调,使模型能更好地理解和执行特定类型的指令。

  增量微调:在已有模型微调的基础上,对模型进行额外的小规模训练,以逐步改进特定方面的性能或适应新数据,而非完全重新微调。

175B、60B、540B

  这些数字代表模型的参数量,单位是十亿(Billion)。例如,“175B”模型有1750亿个参数,表明模型规模巨大,通常与大模型的概念相关联。

强化学习

  强化学习是一种学习框架,其中智能体通过与环境交互,根据执行动作获得的奖励来学习如何做出决策,目的是最大化长期奖励。

基于人工反馈的强化学习(RLHF)

  基于人工反馈的强化学习(Reinforcement Learning from Human Feedback, RLHF)是一种强化学习方法,通过人类评估者的反馈来指导智能体学习,使智能体行为更加符合人类偏好。

涌现

  在复杂系统和深度学习中,涌现是指系统级别的行为或属性,这些行为或属性不能直接从系统组成部分的性质推断得出,而是系统相互作用的结果。例如,在深度学习网络中,高级抽象特征的出现可以视为一种涌现现象。

思维链

思维链不是标准术语,但可以理解为在深度学习和人工智能中,一系列连续的思维或推理步骤,尤其是那些试图模拟人类思考过程的模型中,通过多阶段的决策和信息处理,形成一个逻辑上连贯的思维序列。

深度学习领域的名词解释:SOTA、端到端模型、泛化、RLHF、涌现 ..的更多相关文章

  1. 【转】贾扬清:希望Caffe成为深度学习领域的Hadoop

    [转:http://www.csdn.net/article/2015-07-07/2825150] 在深度学习(Deep Learning)的热潮下,Caffe作为一个高效.实用的深度学习框架受到了 ...

  2. (转)能根据文字生成图片的 GAN,深度学习领域的又一新星

    本文转自:https://mp.weixin.qq.com/s?__biz=MzIwMTgwNjgyOQ==&mid=2247484846&idx=1&sn=c2333a998 ...

  3. 深度学习领域的Papers

    https://github.com/songrotek/Deep-Learning-Papers-Reading-Roadmap 深度学习论文阅读路线图 Deep Learning Papers R ...

  4. 自己动手实现深度学习框架-8 RNN文本分类和文本生成模型

    代码仓库: https://github.com/brandonlyg/cute-dl 目标         上阶段cute-dl已经可以构建基础的RNN模型.但对文本相模型的支持不够友好, 这个阶段 ...

  5. 吴恩达《深度学习》-课后测验-第五门课 序列模型(Sequence Models)-Week 2: Natural Language Processing and Word Embeddings (第二周测验:自然语言处理与词嵌入)

    Week 2 Quiz: Natural Language Processing and Word Embeddings (第二周测验:自然语言处理与词嵌入) 1.Suppose you learn ...

  6. 学习“花书“《深度学习》中文PDF和英文PDF

    个人觉得github上的中文版翻译的不错,有700多页,深度学习入门经典书籍,前几章的数学基础介绍的相当不错. 第一部分基本就是统计学习最基础的线性代数,概率论等,第4章值得一读,讲了些数值分析里常涉 ...

  7. 曼孚科技:AI领域3种典型的深度学习算法

    ​深度学习(Deep Learning)是机器学习(Machine Learning)领域中一个新的研究方向,引领了第三次人工智能的浪潮. 本文整理了深度学习领域3种典型的算法,希望可以帮助大家更好地 ...

  8. 【深度学习Deep Learning】资料大全

    最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books  by Yoshua Bengio, Ian Goodfellow and Aaron C ...

  9. Deep Learning(深度学习)学习笔记整理

    申明:本文非笔者原创,原文转载自:http://www.sigvc.org/bbs/thread-2187-1-3.html 4.2.初级(浅层)特征表示 既然像素级的特征表示方法没有作用,那怎样的表 ...

  10. 【Todo】【转载】深度学习&神经网络 科普及八卦 学习笔记 & GPU & SIMD

    上一篇文章提到了数据挖掘.机器学习.深度学习的区别:http://www.cnblogs.com/charlesblc/p/6159355.html 深度学习具体的内容可以看这里: 参考了这篇文章:h ...

随机推荐

  1. 19、python 脚本

    1.python 安装及配置 下载地址 python2 和 python3 共存安装 2.python 可视化 import turtle turtle.pensize(2) #画一个小圆 turtl ...

  2. Oracle修改字段长度及属性

    首发微信公众号:SQL数据库运维 原文链接:https://mp.weixin.qq.com/s?__biz=MzI1NTQyNzg3MQ==&mid=2247486117&idx=1 ...

  3. Istio(三):服务网格istio可观察性:Prometheus,Grafana,Zipkin,Kiali

    目录 一.模块概览 二.系统环境 三.可观察性 四.指标 4.1 代理级指标 4.2 服务级指标 4.3 控制平面度量 五.Prometheus 5.1 安装Prometheus 5.2 部署示例应用 ...

  4. ESP8266资源整理

    概述 整理下学习ESP8266期间有价值的资料 乐鑫官网文档中心 主要参考资料来源,一手资料最有价值,另外官网还有选型工具.产品对比等实用工具 https://www.espressif.com.cn ...

  5. EasyUI框架Datagrid(数据表格)的实现,以及Datagrid的分页显示(详解)

    在前端页面中使用EasyUI框架时,通常会使用EasyUI自带的datagrid(数据表格)样式,下面我们对datagrid样式进行简单的介绍,并且会对datagrid的分页显示进行详细的介绍. Ea ...

  6. 【论文笔记】轻量级网络MobileNet

    [深度学习]总目录 MobileNet V1:<MobileNets: Efficient Convolutional Neural Networks for MobileVision Appl ...

  7. 大厂边缘组VS小厂核心组,要怎么选?

    有问必答 最近有粉丝提问:大厂边缘组VS小厂核心组,怎么选? 这确实是个好问题,读者老爷们可以先问下自己:如果有一份月薪2W在大厂边缘组打螺丝的Offer且不加班,另外还有一份月薪2W5,在小厂核心组 ...

  8. 使用Wesky.Net.Opentools库,一行代码实现实体类类型转换为Json格式字符串

    安装1.0.10以及以上版本的 Wesky.Net.OpenTools 包   包内,该功能的核心代码如下: 自定义属性: 实体类JSON模式生成器:   使用方式:引用上面的1.0.10版本或以上的 ...

  9. react props进阶 children属性

    children属性,表示组件标签的子节点,当组件标签有子节点时,props就会有该属性,与与普通的props一样,其值可以使任意类型. # 父组件 class App extends React.C ...

  10. React脚手架 创建React项目

    React团队主要推荐使用create-react-app来创建React新的单页应用项目的最佳方式. React脚手架(create-react-app)意义 脚手架是官方提供,零配置,无需手动配置 ...