判别式 AI 与生成式 AI
本文摘选来自: AI 智能体开发指南
一、背景
为了解决不同的应用场景,在AI的发展过程中,机器学习模型逐步分化为 判别式(Discriminative)和生成式(Generative) 两各技术路线,从而形成了AI的两大派别。它们分别在分类、回归、模式识别以及数据生成等任务中发挥核心作用。
为了避免在AI技术选型过程中走弯路,为应用场景匹配不合适的AI,我们有必要了解两种AI的核心差异。
二、判别式AI:模式识别与分类任务的核心
判别式AI模型主要用于分类和预测任务,目标是建模输入(X)与输出(Y)之间的决策边界,即直接学习P(Y|X)。典型的判别式算法包括 逻辑回归(Logistic Regression)、支持向量机(SVM)、随机森林(Random Forest)、深度神经网络(DNN) 等。这类模型在计算机视觉、语音识别、自然语言处理等领域发挥了巨大作用。例如,2012年AlexNet在ImageNet挑战赛上大获成功,证明了深度卷积神经网络(CNN)在图像分类任务上的卓越能力。后续的ResNet、EfficientNet等模型进一步推动了判别式AI的发展,使其在目标检测、语音转文字、情感分析等任务上达到了接近人类水平的表现。
在自然语言处理领域,BERT等自监督学习的预训练模型也属于判别式AI的范畴。BERT的训练目标是通过 掩码语言模型(Masked Language Model, MLM) 预测缺失单词,其双向上下文理解能力极大提升了AI的文本理解能力,使其广泛应用于信息检索、情感分析、机器翻译等任务。
值得一提的是,判别式AI对硬件处理能力的要求更低,甚至可以在移动终端上运行,如图1。
基于AI技术的翻译机

(基于AI技术的翻译机)
三、生成式AI:从数据学习到创造新内容
与判别式模型不同,生成式AI的目标是学习数据的分布,并生成与训练数据相似的新样本,即建模P(X) 或 P(X|Z)(Z为隐变量,即没有预先定义的变量,隐变量的存在是判别式AI准确率缺陷的主要成因)。生成式模型不仅可以用于数据增强,还能在无标签数据环境下进行自监督学习,为AI带来了更广泛的应用场景。
生成式AI的早期探索始于隐马尔可夫模型(HMM)和玻尔兹曼机(Boltzmann Machines),但真正的突破出现在2014年,生成对抗网络(GANs) 的提出引发了AI在图像生成领域的革命。GAN由生成器(Generator) 和 判别器(Discriminator) 组成,通过博弈的方式不断优化,使生成的数据越来越接近真实样本。2017年,前文介绍的BERT/Transformer提出后,生成式AI进入快速发展阶段,OpenAI基于此架构推出的GPT系列(Generative Pre-trained Transformer)成为生成式AI的标志性成果。GPT-3、GPT-4等大规模语言模型能够基于大量文本数据进行预训练,并在下游任务中表现出极强的语言理解与生成能力。生成式AI不仅限于文本生成,还广泛应用于多模态领域,如文本生成图像(如图2)、音频合成、视频生成等。多模态生成式AI的进步,使得AI能够更自然地理解和创造内容,推动了艺术创作、设计自动化、游戏开发等多个行业的变革。

(图2:使用通义万象生成图片)
四、判别式 vs 生成式:优势、局限性与融合趋势
尽管判别式AI和生成式AI在建模方式和应用场景上有所不同,但二者在实践中往往相辅相成。判别式AI擅长分类、检测和回归任务,计算效率高、泛化能力强,在生产环境中更易部署。但其主要局限在于数据依赖性强、无法生成新数据,因此在低数据场景或创新内容生成方面能力有限。
相比之下,生成式AI的优势在于能够建模数据的分布并生成新样本,在低数据场景下仍能有效工作,适用于数据增强、仿真模拟、个性化内容创作等任务。然而,生成式AI往往计算成本较高,训练过程不稳定,并存在模式崩溃(Mode Collapse)、难以控制生成内容等问题。此外,由于生成式AI的内容高度依赖训练数据,其在真实性、可控性和伦理问题上也面临较大挑战。详细对比如图3所示。

(图3:判别式AI与生成AI对比)
随着AI技术的发展,判别式和生成式的融合趋势越来越明显。例如,GAN本身就结合了判别模型和生成模型的优势,而近年来的自监督学习(Self-Supervised Learning, SSL) 也开始采用生成式预训练+判别式微调的策略。GPT-4等大模型在预训练阶段采用自回归生成方式,但在推理过程中可以进行判别式优化,以提高模型的可靠性和稳定性。这种趋势表明,未来的AI系统可能不再严格区分判别式和生成式,而是结合二者的优点,实现更强的泛化能力和创造力。
五、典型应用场景示例
活字格低代码开发平台可引入判别式AI和生成式AI,加速新技术落地。
5.1 判别式AI:增强型OCR(快递面单识别)
需求概述:通过快递面单来自动解析出收发件人信息
核心能力:AI增强型OCR(插件:百度AI)
下载地址:https://marketplace.grapecity.com.cn/ApplicationDetails?productID=SP2309140002
5.2 生成式AI:文本生成workflow(文章撰写)
需求概述:基于用户提供的关键字自动编写对SEO友好的市场宣传用文章
核心能力:AI助手命令(内置插件)
工程地址:https://gitee.com/low-code-dev-lab/hzg-demo-web-api-ai-integration
本文摘选来自: AI 智能体开发指南
判别式 AI 与生成式 AI的更多相关文章
- 生成式AI会成为是人工智能的未来吗
生成式 AI 是一项创新技术,可帮助算法人员生成以前依赖于业务员的模型,提供创造性的结果,而不会因业务员思想和经验而产生任何差错. 人工智能中的这项新技术确定了输入的原始模型,以生成演示训练数据特征. ...
- 生成式AI对业务流程有哪些影响?企业如何应用生成式AI?一文看懂
集成与融合类ChatGPT工具与技术,以生成式AI变革业务流程 ChatGPT背后的生成式AI,聊聊生成式AI如何改变业务流程 ChatGPT月活用户过亿,生成式AI对组织的业务流程有哪些影响? 生成 ...
- 百度生成式AI产品文心一言邀你体验AI创作新奇迹:百度CEO李彦宏详细透露三大产业将会带来机遇(文末附文心一言个人用户体验测试邀请码获取方法,亲测有效)
目录 中国版ChatGPT上线发布 强大中文理解能力 智能文学创作.商业文案创作 图片.视频智能生成 中国生成式AI三大产业机会 新型云计算公司 行业模型精调公司 应用服务提供商 总结 获取文心一言邀 ...
- AI 判别式模型和生成式模型
判别式模型(discriminative model) 生成式模型(generative model) 对于输入x,类别标签y:产生式模型估计它们的联合概率分布P(x,y)判别式模型估计条件概率分布P ...
- Strong AI Versus Weak AI
Computer Science An Overview _J. Glenn Brookshear _11th Edition The conjecture that machines can be ...
- 人机ai五子棋 ——五子棋AI算法之Java实现
人机ai五子棋 下载:chess.jar (可直接运行) 源码:https://github.com/xcr1234/chess 其实机器博弈最重要的就是打分,分数也就是权重,把棋子下到分数大的地方, ...
- 判别式模型 vs. 生成式模型
1. 简介 生成式模型(generative model)会对\(x\)和\(y\)的联合分布\(p(x,y)\)进行建模,然后通过贝叶斯公式来求得\(p(y|x)\), 最后选取使得\(p(y|x) ...
- Excel催化剂开源第25波-Excel调用百度AI,返回AI结果
现成的这些轮子,无需调用网页,直接本地离线即可生成). 当然在AI时代,少不了各种AI接口的使用场景,普通开发者只需聚焦在自己的业务场景上,这些AI底层技术,只需类似水煤电一般去BAT这些大厂那里去消 ...
- Machine Learning系列--判别式模型与生成式模型
监督学习的任务就是学习一个模型,应用这一模型,对给定的输入预测相应的输出.这个模型的一般形式为决策函数:$$ Y=f(X) $$或者条件概率分布:$$ P(Y|X) $$监督学习方法又可以分为生成方法 ...
- 从k8s 的声明式API 到 GPT的 提示语
命令式 命令式有时也称为指令式,命令式的场景下,计算机只会机械的完成指定的命令操作,执行的结果就取决于执行的命令是否正确.GPT 之前的人工智能就是这种典型的命令式,通过不断的炼丹,告诉计算机要怎么做 ...
随机推荐
- CUDA异常捕获
技术背景 在CUDA编程中有可能会遇到一些相对比较隐蔽的报错,但是直接编译运行cu文件是不显现的.那么可以通过添加一个用于检查的宏,来监测CUDA程序运行过程中可能出现的报错. error.cuh 我 ...
- Hive - [06] 行转列,列转行
行转列(多行转一行) 1.创建表,并插入示例数据. create table students_info( `SNO` string comment '学生编号', `name` string com ...
- Vuex:让状态管理不再头疼的“管家”
如果你正在开发一个 Vue.js 应用程序,但发现自己被各种组件之间的状态共享问题搞得焦头烂额,那么 Vuex 就是你需要的"超级管家".Vuex 是专门为 Vue.js 设计的状 ...
- 印度股票实时行情API数据源接口
StockTV API: 提供实时和历史行情数据,覆盖印度所有股票和指数,支持WebSocket和REST API接口.(推荐使用,对接简单,有技术支持) 新浪财经:提供股票市场数据,可以优先考虑 ...
- SqlmapAPI:自动化SQL注入的利器
SqlmapAPI:自动化SQL注入的利器 SqlmapAPI简介 SqlmapAPI是基于sqlmap工具的API接口,它允许用户通过编程方式调用sqlmap的功能,实现自动化的SQL注入安全检测. ...
- go generate
介绍 go generate 命令是go 1.4版本里面新添加的一个命令,当运行 go generate 时,它将扫描与当前包相关的源代码文件,找出所有包含 //go:generate 的特殊注释,提 ...
- 使用Python完成设备巡检
在企业网络中,设备巡检是保持网络稳定性和安全性的核心任务.无论是路由器.交换机,还是防火墙和服务器等设备,都需要定期进行巡检,以确保网络设施的正常运行.然而,传统的设备巡检通常是通过手动登录设备.查看 ...
- 基于SLAM系统建图仿真,完成定位仿真
博客地址:https://www.cnblogs.com/zylyehuo/ 基于SLAM系统完成建图仿真,详见之前的博客 基于Gazebo搭建移动机器人,并结合SLAM系统完成建图仿真 - zyly ...
- Unsloth更快训练大模型并导出GGUF - Windows
环境搭建 系统环境 需要Nvidia显卡,至少8G显存,且专用显存与共享显存之和大于20G 建议将非安装版的环境文件都放到非系统盘,方便重装或移植 以Windows11为例,非安装环境文件都放在 E ...
- [源码系列:手写spring] IOC第十三节:Bean作用域,增加prototype的支持
为了帮助大家更深入的理解bean的作用域,特意将BeanDefinition的双例支持留到本章节中,创建Bean,相关Reader读取等逻辑都有所改动. 内容介绍 在Spring中,Bean的作用域( ...