为什么RAG技术可以缓解大模型知识固话和幻觉问题
1、大模型知识固化和幻觉问题
要理解大模型的时效性问题,需首先明确其技术原理:大模型通过输入文本与已固化在神经网络中的知识进行匹配,预测并输出概率最大的文本内容作为答案。其固化知识的神经网络形成于前期训练阶段,训练输入源自人类现有知识数据(包括互联网及线下知识数据)。模型一旦训练完成,其知识范围便被固定,回答能力完全取决于训练时的数据内容。
幻觉产生的原因是:无论匹配概率多低,模型总会生成输出,这种缺乏依据的输出如同人类空想,即形成幻觉。
如图所示:若大模型A基于2024年12月31日前的数据训练,当询问"2025年发生了哪些地震"时,它无法提供真实信息,强行回答则会虚构内容,因其神经网络中并无2025年数据。

因此,大语言模型面临两大核心问题:
1.知识固化:模型仅能回答训练数据范围内的内容,对训练后发生的事件(如2025年新发生的世界信息)或未参与训练的私有数据(如公司内部信息),统称为"外部知识"的内容,均无法直接回答。
2.幻觉与不可溯源:由于模型输出本质是对固化知识的重组,用户难以验证信息来源,导致不敢轻易相信。
2、RAG技术出现之前的解决方案
在RAG技术出现前,解决知识固化的主流方式是通过补充外部知识对模型进行持续微调,即利用新数据训练生成新模型(如下图所示)。

但该方案效率低,成本高,主要原因包括:
1.需庞大训练数据支撑
2.模型训练需要高昂GPU计算资源
3.模型训练技术门槛要求高
4.训练周期长,且效果不稳定
5.模型更新繁琐:如上图,即使在2025年8月9日好不容易完成了大模型B、C的迭代,仍无法覆盖2025年8月9日后的新知识。
3、RAG技术解决知识固化和幻觉问题的原理
RAG是英文(Retrieval-Augmented Generation,检索增强生成)的缩写,是由 Meta AI(原Facebook AI) 的研究团队于2020年首次提出,核心论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》(Patrick Lewis等)发表于2021年4月,论文地址:https://arxiv.org/pdf/2005.11401。
RAG的核心思想是不将新出现的知识内容用于大模型的训练,而是将最新的的问题相关的知识和要问的问题一起送给大模型,利用大模型语言组织能力,形成自然语言形式的答案。
RAG的核心思想是:不将新知识纳入模型训练,而是将实时问题与相关外部知识同步一起输入给模型,利用大模型的语言组织能力生成答案。如下图所示:

第①步:为实时信息/本地数据建立向量索引库。
第②步:用户提问后,将问题向量化;
第③步:通过向量匹配,在第①步中建立的索引库中检索出最相关的条目
第④步:整合问题与检索结果生成提示词,输入给大模型
例如:“2025年发生了哪些地震?请参考如下信息回答:①2025.1.7西藏定日地震,②2025.7.30堪察加地震,回答时需标注参考条目序号"”
第⑤步:将大模型回复结果转述给用户
例如:“2025年发生了两次地震,包括1月7日定日地震,7月30日勘察加地震。参考条目① ②”
RAG巧妙的通过本地信息搜索和大模型集合的流程解决了知识固化问题,同时又避免了模型训练的高成本。而且通过展示参考条目,用户可验证信息来源,有效缓解幻觉问题。
4、那么问题来了,既然能够提前检索到信息,还用大模型做什么?
首先,传统检索只能返回相关段落或者片段,但是大模型却可以生成人性化的自然语言描述的答案。另外,大模型还能基于已有的基础知识进行信息的组织,甚至跨文档推理。如果没有大模型,信息检索就和传统搜索引擎的效果差不多了。
为什么RAG技术可以缓解大模型知识固话和幻觉问题的更多相关文章
- 千亿参数开源大模型 BLOOM 背后的技术
假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,"一朝看尽长安花"似乎近在眼前 -- 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM ...
- 华为高级研究员谢凌曦:下一代AI将走向何方?盘古大模型探路之旅
摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦.谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的"前世今生",以及它背后的艰难 ...
- 无插件的大模型浏览器Autodesk Viewer开发培训-武汉-2014年8月28日 9:00 – 12:00
武汉附近的同学们有福了,这是全球第一次关于Autodesk viewer的教室培训. :) 你可能已经在各种场合听过或看过Autodesk最新推出的大模型浏览器,这是无需插件的浏览器模型,支持几十种数 ...
- PowerDesigner 学习:十大模型及五大分类
个人认为PowerDesigner 最大的特点和优势就是1)提供了一整套的解决方案,面向了不同的人员提供不同的模型工具,比如有针对企业架构师的模型,有针对需求分析师的模型,有针对系统分析师和软件架构师 ...
- PowerDesigner 15学习笔记:十大模型及五大分类
个人认为PowerDesigner 最大的特点和优势就是1)提供了一整套的解决方案,面向了不同的人员提供不同的模型工具,比如有针对企业架构师的模型,有针对需求分析师的模型,有针对系统分析师和软件架构师 ...
- web前端体系-了解前端,深入前端,架构前端,再看前端。大体系-知识-小细节
1.了解前端,深入前端,架构前端,再看前端.大体系-知识-小细节 个人认为:前端发展最终的导向是前端工程化,智能化,模块化,组件化,层次化. 2.面试第一关:理论知识. 2-1.http标准 2-2. ...
- 有必要了解的大数据知识(一) Hadoop
前言 之前工作中,有接触到大数据的需求,虽然当时我们体系有专门的大数据部门,但是由于当时我们中台重构,整个体系的开发量巨大,共用一个大数据部门,人手已经忙不过来,没法办,为了赶时间,我自己负责的系统的 ...
- DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍
DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍 1. 概述 近日来,ChatGPT及类似模型引发了人工智能(AI)领域的一场风潮. 这场风潮对数字世 ...
- 一个php技术栈后端猿的知识储备大纲
<h1 align="center">Easy Tips</h1><p align="center"><a href= ...
- Atitit 快速开发的推荐技术标准化 规范 大原则
Atitit 快速开发的推荐技术标准化 规范 大原则 1. 如何评估什么样的技术适合快速开发??1 1.1. (重要)判断语言层次..层次越高开发效率越高 4gl dsl> 3.5gl &g ...
随机推荐
- curl ifconfig.me 查看Linux服务器公网IP地址
命令作用:curl ifconfig.me 用于查看Linux服务器公网IP地址. 使用场景:配置Linux服务器IP白名单的时候,需要知道服务器的IP地址,这就到此命令大显身手的时候了.
- 如何在 .NET 中构建一个好用的动态查询生成器
前言 自从.NET Framework 3.5提供了LINQ之后,集合数据查询基本被LINQ统一了.这大幅提高了编写数据查询代码的效率和质量,但是在需要编写动态查询的时候反而很困难,特别是最常用的wh ...
- CSP-S 2020模拟训练题1-信友队T2 挑战NPC
题意简述 有一个\(k\)维空间,每维的跨度为\(L\),即每一维的坐标只能是\(0,1, \cdots ,L-1\).每一步你可以移动到任意一个曼哈顿距离到自己小于等于\(d\)的任意一个合法坐标. ...
- 通义灵码2.5+qwen3——节假日抢票不用愁,基于12306-MCP实现个人火车票智能查询小助手!
在日常生活中,12306 是中国铁路售票系统的官方平台.为了提升购票效率.自动化查询余票信息以及获取车站代码等功能,我们希望通过使用智能体编程方式,结合 MCP(Model-as-a-Servic ...
- 袋鼠云批流一体分布式同步引擎ChunJun(原FlinkX)的前世今生
一.前言 ChunJun(原FlinkX)是一个基于Flink提供易用.稳定.高效的批流统一的数据集成工具,是袋鼠云一站式大数据开发平台-数栈DTinsight的核心计算引擎,其技术架构基于实 ...
- 常见php正则表达式
$str=preg_replace("/\s+/", " ", $str); //过滤多余回车 $str=preg_replace("/<[ ] ...
- 【Cursor保姆级教程】零基础小白从安装到实战,手把手教你玩转AI编程神器!
1.什么是AI编程? 在传统的编程模式中,开发程序是一项高度专业化的任务.程序员需要具备深厚的技术背景,掌握至少一门编程语言比如Python.Java.C++等等.并且要对复杂的逻辑和算法有清晰的理解 ...
- sql更新数据
插入数据-insert 单条插入 insert into 表名 (列1,列2...)values(值1,值2...) 批量插入 insert into c_student(student_id,stu ...
- vue-cli3项目开启less支持并引入短链接
说明用脚手架搭建的时候,可以在选项中开启(支持less).但是如果项目已经建好了这个时候想开启支持,就需要额外做些事情了支持less安装该插件 vue add style-resources-load ...
- Python 潮流周刊#110:JIT 编译器两年回顾,AI 智能体工具大爆发(摘要)
本周刊由 Python猫 出品,精心筛选国内外的 400+ 信息源,为你挑选最值得分享的文章.教程.开源项目.软件工具.播客和视频.热门话题等内容.愿景:帮助所有读者精进 Python 技术,并增长职 ...