大家好,我是Edison。

之前说过,我们即将开始一段AIGC学习之旅,从ChatGPT到Github Copilot再到Semantic Kernel,第一站是ChatGPT。在这一站,我们花一点时间快速了解一下ChatGPT,并做一些实战实际体会下ChatGPT能够对我们带来怎样的改变。

GPT到底是什么

首先,我们需要了解GPT的全称:Generative Pre-trained Transformer,即三个关键词:生成式 预训练 变换模型

(1)什么是生成式

即能够生成新的文本序列。

(2)什么是预训练

即能够在模型数据集基础上进行无监督学习,当学习到一些通用的特征或知识,就能够讲这些知识迁移到其他任务上。

这种无监督学习,是没有标签/目标,也没有反馈,它自己会寻找数据中隐藏的结构。下图展示了三种学习模式的差别,而ChatGPT采用的实无监督学习 和 强化学习。

(3)什么是变换模型

这是一种神经网络结构,通过对输入序列的层层处理,得到最终的输出。

简单地说,它就是一个黑盒子,例如我们在做文本的翻译任务时,当我们输入一个中文,经过这个黑盒子,输出翻译后的英文。当然,这个黑盒子内部有一系列的复杂操作,通过一些 encoder 和 decoder 生成最终的输出,如下图所示。

GPT的本质是猜概率

现阶段的GPT都是在“玩文字游戏”,它只是在进行一次又一次的概率解题,和我们玩填字游戏是一个逻辑,只不过,我们人类是靠知识和智慧,而AI主要靠概率计算。经过大量的数据训练后,AI预测到下图所示的空格中可能会出现的最高概率的词,进而将其进行输出。

在基于大语言模型(LLM)基础上,逐渐演进出了两个最主流的方向:BERT 和 GPT。在GPT3.0发布前,GPT一直弱于BERT,而3.0发布之后GPT貌似一骑绝尘了。GPT方向上,最知名的玩家非OpenAI莫属,从我们开始熟悉的GPT3.5到GPT4.0。

生成式AI全景图

生成式AI应用全景图如下图所示,可以看到,它可以做很多个类别的事情,从文本到编码再到图片,以及今年Sora大模型掀起的视频生成浪潮,基于每个类别提供的动力,我们可以在其上层开发构件潜在的应用程序。

目前生成式AI应用最广泛的当属 文本 和 编码 了,也可以看到,文本 只是 生成式AI生态中的 一环,而不是全部,而这一环就是我们现在学习的 ChatGPT。

ChatGPT的进化过程

下面这张图完整展示了ChatGPT的进化过程,经过了多年的技术积累,最终形成了针对人类反馈信息学习的大规模预训练语言模型。

ChatGPT可以做什么

ChatGPT很能干,它可以干50+件事情!

其中,问答、翻译、写文案、提炼文字、生成代码、代码解释 等是最常见的应用场景。

ChatGPT不可以做什么

首先,我们需要知道:ChatGPT本身不是联网的,它的大模型本身就存在时效性,在解决你的问题之前,它所学到的知识将始终落后当前一段时间,因为大模型的重新训练成本很大,因此不是每天更新的,所以不会联网。

因此,我们便可以知道,ChatGPT还不会很快地取代Google和百度帮你查到最新的技术文档,也没法代替小爱同学帮你查询天气,无法替代高德地图帮你推荐附近的美食 等等。

小结

本篇,我们了解了GPT的含义 以及 ChatGPT的演进过程,以及ChatGPT能做什么 和 不能做什么。下一篇,我们了解下ChatGPT的核心训练方式:Prompt。

参考资料

李佳芮,《ChatGPT从0到1

林健,《零基础GPT应用入门课

Global AI Bootcamp 成都站,梁桐铭,《学习如何使用Prompt与OpenAI模型对话》

作者:周旭龙

出处:https://edisonchou.cnblogs.com

本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接。

ChatGPT学习之旅 (1) 初步了解ChatGPT的更多相关文章

  1. 算法题学习链路简要分析与面向 ChatGPT 编程

    本文已收录到 AndroidFamily,技术和职场问题,请关注公众号 [彭旭锐] 提问. 声明:此图片由 MidJourney 生成 未经训练,不属于任何真实人物 大家好,我是小彭. 2023 开年 ...

  2. 国内“谁”能实现chatgpt,短期穷出的类ChatGPT简评(算法侧角度为主),以及对MOSS、ChatYuan给出简评,一文带你深入了解宏观技术路线。

    1.ChatGPT简介[核心技术.技术局限] ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI 研发的聊天机器人程序 ,于202 ...

  3. asp.net+mvc+easyui+sqlite 简单用户系统学习之旅—— 摘要

    首次接触asp.net开发,希望把自己的学习之旅写下来,一方面做个知识归纳技术总结,另一方面开放到博客中,和大家一起交流学习! asp.net是目前流行的web开发技术之一,是微软旗下开发的基于.ne ...

  4. WCF学习之旅—第三个示例之四(三十)

           上接WCF学习之旅—第三个示例之一(二十七)               WCF学习之旅—第三个示例之二(二十八)              WCF学习之旅—第三个示例之三(二十九)   ...

  5. Hadoop学习之旅二:HDFS

    本文基于Hadoop1.X 概述 分布式文件系统主要用来解决如下几个问题: 读写大文件 加速运算 对于某些体积巨大的文件,比如其大小超过了计算机文件系统所能存放的最大限制或者是其大小甚至超过了计算机整 ...

  6. WCF学习之旅—第三个示例之二(二十八)

    上接WCF学习之旅—第三个示例之一(二十七) 五.在项目BookMgr.Model创建实体类数据 第一步,安装Entity Framework 1)  使用NuGet下载最新版的Entity Fram ...

  7. WCF学习之旅—第三个示例之三(二十九)

    上接WCF学习之旅—第三个示例之一(二十七) WCF学习之旅—第三个示例之二(二十八) 在上一篇文章中我们创建了实体对象与接口协定,在这一篇文章中我们来学习如何创建WCF的服务端代码.具体步骤见下面. ...

  8. WCF学习之旅—WCF服务部署到IIS7.5(九)

    上接   WCF学习之旅—WCF寄宿前的准备(八) 四.WCF服务部署到IIS7.5 我们把WCF寄宿在IIS之上,在IIS中宿主一个服务的主要优点是在发生客户端请求时宿主进程会被自动启动,并且你可以 ...

  9. WCF学习之旅—WCF服务部署到应用程序(十)

    上接  WCF学习之旅—WCF寄宿前的准备(八) WCF学习之旅—WCF服务部署到IIS7.5(九) 五.控制台应用程序宿主 (1) 在解决方案下新建控制台输出项目 ConsoleHosting.如下 ...

  10. WCF学习之旅—WCF服务的Windows 服务程序寄宿(十一)

    上接    WCF学习之旅—WCF服务部署到IIS7.5(九) WCF学习之旅—WCF服务部署到应用程序(十) 七 WCF服务的Windows 服务程序寄宿 这种方式的服务寄宿,和IIS一样有一个一样 ...

随机推荐

  1. 用 PHP 封装的发送邮件类

    点击查看代码 <?php class MailSender { // 发件人邮箱地址 private $fromEmail; // 发件人名称 private $fromName; // 收件人 ...

  2. 【Maven】生命周期

    Maven 有三个相互独立的生命周期:Clean 生命周期.build 生命周期.site 生命周期. 各个构建环节执行的顺序:不能打乱顺序,必须按照既定的正确顺序来执行. Maven 的核心程序中定 ...

  3. Quartz.NET - 教程 8: 调度器监听器

    译者注: 目录在这 Quartz.NET 3.x 教程 原文在这 Lesson 8: SchedulerListeners SchedulerListeners 跟 ITriggerListeners ...

  4. 《机器人SLAM导航核心技术与实战》第1季:第10章_其他SLAM系统

    <机器人SLAM导航核心技术与实战>第1季:第10章_其他SLAM系统 视频讲解 [第1季]10.第10章_其他SLAM系统-视频讲解 [第1季]10.1.第10章_其他SLAM系统_RT ...

  5. GitLab 服务器宕机时的项目代码恢复方法

    重要前提:GitLab 数据挂载盘必须能够正常读取,且 /var/opt/gitlab/git-data/repositories 目录下的数据可以完整拷贝. 当 GitLab 服务器意外宕机且没有备 ...

  6. Transformer(自然语言处理)笔记

    Transerformer架构(自然语言处理) 尝试学习和从零构建一个大语言模型 就目前我的认知 Transformer架构主要分为编码器.解码器.词表.训练集.训练算法(T5) 编码器(Encode ...

  7. 端口telnet不通排查过程

    现状 简单描述下最近在做啥,我手里维护的一些系统的线上服务器,还在使用centos7,7.3/7.6/7.9都有,运维侧选定的替换系统是openEuler20.03-LTS-SP1.按理说,运维直接在 ...

  8. 常用的 JVM 配置参数有哪些?

    常用的 JVM 配置参数 JVM 配置参数可以用来控制 Java 程序的内存分配.垃圾回收.性能优化等.以下是一些常用的 JVM 配置参数: 1. 堆内存相关参数 -Xms:设置 JVM 初始堆内存大 ...

  9. 解决chrome浏览器拓展插件颜色变成透明无法使用。

    虚拟机装了chrome之后插件变成了透明的,没办法使用了. 解决办法如下: 1.卸载VMWARE tools 2.地址栏输入: chrome://flags 找到 "Choose ANGLE ...

  10. Java编程——设计模式目录

    目录 学习指导 https://java-design-patterns.com/zh/patterns/