AI热点概念解读:一文搞懂这些热词
自 ChatGPT 问世以来,AI的风口就来了。
AI是一门研究如何使计算机具有类似人类智能的学科。
自从ChatGPT-3.5给大家带来了极大的震惊之后,全民都在谈论AI,在这个AI大时代背景之下,如果你想进一步了解AI相关热词含义,从而更好的理解当下AI的基础原理,本文就不容错过。

如今,当你找专业人士解释一些关于AI的基础概念,最大的问题就是,你也许只是想简单的了解一个热词的简单解释,回答者跟你解释时,却引入了更多你不熟悉的新概念。
当你不得不追问这些新概念的含义时,却发现又引入了一堆新词,此刻是不是感觉头都大了?其实这么多新词和概念也很难通过一次简短的询问来搞懂并厘清期间的关系。
如果你也有这样的困惑,无论是提问方还是解答方,都可以利用这篇文章来帮助自己理解或辅助回答。
下面我们就从最熟悉的ChatGPT切入提问,看看都有哪些AI相关高频词汇,又各自是什么意思。

ChatGPT 是什么?
ChatGPT是一种LLM(大语言模型),具体是由OpenAI开发的一种聊天型生成预训练模型。它基于GPT架构,专门设计用于处理自然语言对话和生成有意义的回应。
LLM(大语言模型)是什么?
LLM英文全称是:Large Language Model。
大语言模型通常是指参数规模庞大、在大规模语料库上进行训练的自然语言处理模型。
另外LLM也不止OpenAI的GPT一种,还有其他很多家,比如Meta的Llama 2,以及更专注于企业应用的Cohere等。
OpenAI 是什么?
OpenAI是一个人工智能研究实验室,致力于推动人工智能的发展。
OpenAI 是许多先进语言模型的背后力量,其中最著名的就是 GPT 系列。
GPT 是什么?
GPT 全称是 "Generative Pre-trained Transformer",翻译成中文是"生成式预训练转换器"。
GPT 是 OpenAI 提出的一系列预训练语言模型,它采用了 Transformer 架构。这些模型在大规模文本数据上进行预训练,学习了丰富的语言知识,可以用于各种自然语言处理任务。
Transformer 是什么?
Transformer 是一种深度学习架构,被广泛用于处理序列数据,比如自然语言处理(NLP)。
它的自注意力机制使其在处理长距离依赖和捕捉序列中的上下文关系方面非常强大。
GPT 就是基于 Transformer 架构构建的。Transformer 架构的主要组成部分包括编码器(Encoder)和解码器(Decoder)。
Encoder 和 Decoder 怎么理解?
编码器(Encoder)负责将输入序列映射为高维度的向量表示。
解码器(Decoder)用于生成目标序列。
向量(Vector)又是什么?
为了让计算机理解和处理文本,我们需要将离散的令牌转换为连续的表示形式。这时,就引入了向量的概念。
向量是一种包含数值的数组,它能够表示令牌的语义信息。每个维度都承载着特定的语义或信息,使得计算机能够更好地理解文本。
令牌(Token)又是个啥?
在自然语言处理中,我们将文本划分为基本单元,这些基本单元称为令牌。
令牌可以是单词、字符或其他离散的文本单位。在处理文本数据时,我们通常将它们作为模型的输入。
每个令牌代表着文本的一个部分,是构建语言模型的基础。
那令牌如何能够向量化呢?
为了将离散的令牌映射到连续的向量表示,我们使用了嵌入技术。
嵌入(Embedding)是一种将高维度、离散的数据映射到低维度、连续空间的方法。
在自然语言处理中,词嵌入(Word Embedding)是常见的嵌入技术,它将单词映射为密集的向量,捕捉了单词之间的语义关系。
向量化数据存在哪里?
向量化数据建议存储在数据库中,这样能够允许高效的检索和查询。
向量可以作为数据库中的一个字段进行存储,或者存储在专门设计的向量数据库中。
企业AI应用中被高频提到的RAG是个啥?
RAG 全称是 "Retrieval-Augmented Generation",表示一种检索增强生成的方法。
听完这样的解释是不是更懵了?咋就增强了?
好吧,说人话,RAG 模型就是结合了上面我们提过的LLM 和 外部知识库,以实现生成过程的增强和优化。
啥叫外部知识库?为啥如此强大的LLM要结合外部知识库呢?
外部知识库就是LLM在训练过程中未直接学习到的、特定领域或任务的额外信息。
比如企业自己的私域知识,例如某保险公司新推出的一些具体保险产品详情,通用LLM训练时肯定就不可能有这样的知识。
又比如一些特定领域的专业知识,诸如医学数据库、法律文件、科学论文等,通用LLM训练时未完全涵盖或深入理解这些领域。
通过结合这样的外部知识库,RAG 模型能够在生成过程中利用这些额外的知识和上下文,使其在特定企业AI应用中能够更为灵活和强大。

最后,大家觉得ChatGPT到底有没有自己的思想?
笔者认为在理解上述基本原理概念之后,会发现在这个机制下,尽管ChatGPT可以生成看起来像是回应问题或进行对话的文本,让人误以为它有思想,但它其实并不具备深层次的理解、意识或主观性。
不过这也是基于当前的ChatGPT,随着AI技术不断发展未来还真不好说,之前不是就因为担忧AI未来的安全问题,还引发了那场OpenAI的CEO被罢免的事件吗,大家怎么看呢?
AI热点概念解读:一文搞懂这些热词的更多相关文章
- 一文搞懂RAM、ROM、SDRAM、DRAM、DDR、flash等存储介质
一文搞懂RAM.ROM.SDRAM.DRAM.DDR.flash等存储介质 存储介质基本分类:ROM和RAM RAM:随机访问存储器(Random Access Memory),易失性.是与CPU直接 ...
- 基础篇|一文搞懂RNN(循环神经网络)
基础篇|一文搞懂RNN(循环神经网络) https://mp.weixin.qq.com/s/va1gmavl2ZESgnM7biORQg 神经网络基础 神经网络可以当做是能够拟合任意函数的黑盒子,只 ...
- 一文搞懂 Prometheus 的直方图
原文链接:一文搞懂 Prometheus 的直方图 Prometheus 中提供了四种指标类型(参考:Prometheus 的指标类型),其中直方图(Histogram)和摘要(Summary)是最复 ...
- Web端即时通讯基础知识补课:一文搞懂跨域的所有问题!
本文原作者: Wizey,作者博客:http://wenshixin.gitee.io,即时通讯网收录时有改动,感谢原作者的无私分享. 1.引言 典型的Web端即时通讯技术应用场景,主要有以下两种形式 ...
- 一文搞懂vim复制粘贴
转载自本人独立博客https://liushiming.cn/2020/01/18/copy-and-paste-in-vim/ 概述 复制粘贴是文本编辑最常用的功能,但是在vim中复制粘贴还是有点麻 ...
- 三文搞懂学会Docker容器技术(中)
接着上面一篇:三文搞懂学会Docker容器技术(上) 6,Docker容器 6.1 创建并启动容器 docker run [OPTIONS] IMAGE [COMMAND] [ARG...] --na ...
- 三文搞懂学会Docker容器技术(下)
接着上面一篇:三文搞懂学会Docker容器技术(上) 三文搞懂学会Docker容器技术(中) 7,Docker容器目录挂载 7.1 简介 容器目录挂载: 我们可以在创建容器的时候,将宿主机的目录与容器 ...
- 一文搞懂所有Java集合面试题
Java集合 刚刚经历过秋招,看了大量的面经,顺便将常见的Java集合常考知识点总结了一下,并根据被问到的频率大致做了一个标注.一颗星表示知识点需要了解,被问到的频率不高,面试时起码能说个差不多.两颗 ...
- 一文搞懂 js 中的各种 for 循环的不同之处
一文搞懂 js 中的各种 for 循环的不同之处 See the Pen for...in vs for...of by xgqfrms (@xgqfrms) on CodePen. for &quo ...
- 一文搞懂如何使用Node.js进行TCP网络通信
摘要: 网络是通信互联的基础,Node.js提供了net.http.dgram等模块,分别用来实现TCP.HTTP.UDP的通信,本文主要对使用Node.js的TCP通信部份进行实践记录. 本文分享自 ...
随机推荐
- oralce用户锁-表锁
一.数据库在使用中,如果多次使用错误密码登录会导致用户锁住无法正常登陆. 解决方法:dba用户登录后使用语句搞定 alter user testuser account unlock; 注:test ...
- 简单讲透Mac环境下多版本python的环境变量设置,仅对小白生效
windows下设置多版本的python管理相对容器,一切都是可视化的,但linux和mac下的python多版本对于小白来说,可能就没那么容易理解了. python多版本安装的问题 假如,首次安装了 ...
- KSP(坎巴拉)萌新感悟
1.为什么降落月球等无大气星球时减速为亚轨道之后便不再减速,等到快坠落的时候在满节流阀极限减速最省燃料? 因为我们的dv是确定的,燃料能给我们带来一定量的冲量,却因此可以带来不一定量的动量,显然速度越 ...
- NOIP2020游记——AFO之战
阅读时请播放此音乐,这是我精心挑选的,很适合本文. Day-0奇遇 考试前一天,不顺,很不顺,简直可以写小说了.(不想看我车店可以往下翻,Day-1在后边) 我是下午两点从齐齐哈尔出发前往省会哈尔滨的 ...
- 小白学标准库之反射 reflect
1. 反射简介 反射是 元编程 概念下的一种形式,它在运行时操作不同类型的对象,检查对象的类型,大小等信息,对于没有源代码的包反射尤其有用. 设想一个场景,读取一个包中变量 a 的类型,并打印该类型的 ...
- 【滤波】Kalman Filter
from: 卡尔曼滤波教程 (kalmanfilter.net) 总览 关于本教程 关于作者 关于卡尔曼滤波 为什么需要预测算法 卡尔曼滤波简介 必要的背景知识 均值和期望 方差和标准差 正态分布 随 ...
- 【RTOS】基于RTOS的降低功耗的策略
RTOS中降低功耗的策略 Saving Power with an RTOS 介绍 随着绿色节能产品需求的增加,快速增长的移动设备,其电池寿命最受关注,设计者必须要考虑在其设计中如何最大限度的降低功耗 ...
- 有了Composition API后,有些场景或许你不需要pinia了
前言 日常开发时有些业务场景功能很复杂,如果将所有代码都写在一个vue组件中,那个vue文件的代码量可能就几千行了,维护极其困难.这时我们就需要将其拆分为多个组件,拆完组件后就需要在不同组件间共享数据 ...
- [转帖]Linux系统安装之后,如何调节CPU性能策略
https://baize.cc/posts/efc.html#:~:text=Linux%E7%B3%BB%E7%BB%9F%E5%AE%89%E8%A3%85%E4%B9%8B%E5%90%8E% ...
- [转帖]编译安装goofys挂载Scaleway免费75G对象存储
日常•2022年5月29日 goofys编译 goofys是一个开源的使用Go编写的s3存储桶挂载工具,主打高性能.由于使用Go编写,没有用到什么特别的依赖,自己编译也很容易.截止2022.5.2 ...