Kernel Memory 入门系列： RAG 简介

宵伯特 2025-12-24 15:26:18 原文

Kernel Memory 入门系列： RAG 简介

开一个新坑，Semantic Kernel系列会在 Release 1.0 之后陆续更新。

当我们有了一定的产品资料或者知识内容之后，自然想着提供一个更加方便的方式让用户能够快速地找到自己想要的信息，或者得到一个更加智能的答案。

以往的时候可能需要通过一些搜索引擎或者问答系统来实现，但是这些系统往往需要极高的维护成本，而且对于用户来说也不是很友好。很多时候仍然需要用户自己去思考问题的表达方式，然后再去搜索或者提问，可以说是费事费力。

如今有了大语言模型，我们就可以考虑通过它来实现一个更加智能的问答系统，为用户提供一个更加友好的交互方式。

从对话开始

当我们直接接入大语言的模型的时候，往往会遇到一个很常见的问题，就是它对于我们私有的数据，小众领域的信息或者较新的知识并不知道。

这源自于大语言模型的训练数据集的限制，它的数据往往来自于大众的语料库，所以对于公开的信息了解的就比较多，但是对于私有的数据，小众领域的信息都不在它的知识范围内，而且由于训练成本和时间的限制，它也不可能实时地去更新模型本身的知识。

这个时候得到“不知道”的答案反而是一个好事儿，起码看得出来这个模型是有一定的智能的，它知道自己不知道，而不是随便瞎猜。毕竟处理大模型的幻觉也是很大的一个问题。

补充上下文

那么这个时候如果想要让模型能够为我们所用的，就需要上一点技术手段了。

最简单的方法就是在与大模型沟通的时候，增加一些上下文的信息。

那这里的上下文就是我们所能够提供给模型的，用于回答用户问题的信息了。

那么接下来的问题就是，这个上下文信息是怎么来的？

RAG

我们需要从整个流程来回溯一下：

首先用户提出问题，这个问题从始至终不会发生变化
然后我们需要理解用户的问题，知道用户提问的意图和方向
接下来就是我们需要根据用户的问题，去检索我们的知识库，找到与用户问题相关的信息，查找出与之相关的的文档或者文本内容
最后我们需要将这些文档或者文本内容进行整合，组成一个完整的提示词，提供给大语言模型用于生成
最后通过大语言模型生成相对精确的答案，返回给用户

这个过程就被称为 RAG(Retrieval Augmented Generation)，也就是检索增强生成。

参考资料

检索增强生成 (RAG)

Kernel Memory 入门系列： RAG 简介的更多相关文章

saltstack之基础入门系列文章简介
使用saltstack已有一段时间,最近由于各种原因,特来整理了saltstack基础入门系列文章,已备后续不断查阅(俗话说好记性不如烂笔头),也算是使用此工具的一个总结.saltstack的前六篇文 ...
Semantic Kernel 入门系列：🥑Memory内存
了解的运作原理之后,就可以开始使用Semantic Kernel来制作应用了. Semantic Kernel将embedding的功能封装到了Memory中,用来存储上下文信息,就好像电脑的内存一样 ...
C#刷遍Leetcode面试题系列连载（1） - 入门与工具简介
目录为什么要刷LeetCode 刷LeetCode有哪些好处? LeetCode vs 传统的 OJ LeetCode刷题时的心态建设 C#如何刷遍LeetCode 选项1: VS本地Debug + ...
Android视频录制从不入门到入门系列教程(一)————简介
一.WHY Android SDK提供了MediaRecorder帮助开发者进行视频的录制,不过这个类很鸡肋,实际项目中应该很少用到它,最大的原因我觉得莫过于其输出的视频分辨率太有限了,满足不了项目的 ...
快速入门系列--WebAPI--03框架你值得拥有
接下来进入的是俺在ASP.NET学习中最重要的WebAPI部分,在现在流行的互联网场景下,WebAPI可以和HTML5.单页应用程序SPA等技术和理念很好的结合在一起.所谓ASP.NET WebAPI ...
linux入门系列12--磁盘管理之分区、格式化与挂载
前面系列文章讲解了VI编辑器.常用命令.防火墙及网络服务管理,本篇将讲解磁盘管理相关知识. 本文将会介绍大量的Linux命令,其中有一部分在"linux入门系列5--新手必会的linux命令 ...
数据挖掘入门系列教程（三）之scikit-learn框架基本使用（以K近邻算法为例）
数据挖掘入门系列教程(三)之scikit-learn框架基本使用(以K近邻算法为例) 简介 scikit-learn 估计器加载数据集进行fit训练设置参数预处理流水线结尾数据挖掘入门系 ...
数据挖掘入门系列教程（十一）之keras入门使用以及构建DNN网络识别MNIST
简介在上一篇博客:数据挖掘入门系列教程(十点五)之DNN介绍及公式推导中,详细的介绍了DNN,并对其进行了公式推导.本来这篇博客是准备直接介绍CNN的,但是想了一下,觉得还是使用keras构建一个D ...
Go语言入门系列(五)之指针和结构体的使用
Go语言入门系列前面的文章: Go语言入门系列(二)之基础语法总结 Go语言入门系列(三)之数组和切片 Go语言入门系列(四)之map的使用 1. 指针如果你使用过C或C++,那你肯定对指针这个概念 ...
机器学习系列入门系列[七]：基于英雄联盟数据集的LightGBM的分类预测
1. 机器学习系列入门系列[七]:基于英雄联盟数据集的LightGBM的分类预测 1.1 LightGBM原理简介 LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个 ...

随机推荐

.NET Core WebAPI 基础文件上传
昨天分享了一个在WebApi中如何接收参数的文章 .NET API 中的 FromRoute.FromQuery.FromBody 用法 - 一事冇诚 - 博客园 (cnblogs.com),然后有新 ...
运用手机运营商二要素Api接口，守护您的账户和隐私，让您安心使用！
随着移动互联网的普及,我们的生活离不开手机,手机成为了我们生活中不可或缺的一部分.但是随着移动支付的普及,手机支付在我们的生活中也变得越来越重要.手机支付是一种方便快捷的支付方式,但是也存在一些安全隐 ...
入门篇-其之二-Java基础知识
目录对第一个Java程序的思考外层结构--类内层结构--main方法输出语句注释单行注释多行注释文档注释文档注释常用标签使用javadoc命令生成网页风格的文档阿里巴巴Java开 ...
面霸的自我修养：ThreadLocal专题
王有志,一个分享硬核Java技术的互金摸鱼侠加入Java人的提桶跑路群:共同富裕的Java人今天是<面霸的自我修养>第5篇文章,我们一起来看看面试中会问到哪些关于ThreadLocal ...
LSP 链路状态协议
转载请注明出处: 链路状态协议(Link State Protocol)是一种在计算机网络中用于动态计算路由的协议.它的主要作用是收集网络拓扑信息,为每个节点构建一个准确的网络图,并基于这些信息计算出 ...
使用Java统计gitlab代码行数
一.背景: 需要对当前公司所有的项目进行代码行数的统计二. 可实现方式 1.脚本:通过git脚本将所有的项目拉下来并然后通过进行代码行数的统计样例: echo 创建项目对应的文件夹 mkdir 项 ...
css 10-13
1.背影样式 backgroud-color 背景颜色 backgroud-color :red backgroud-image 背 ...
Redis中的缓存雪崩、缓存击穿、缓存穿透问题
1. 什么是缓存雪崩当我们提到缓存系统中的问题,缓存雪崩是一个经常被讨论的话题.缓存雪崩是指在某一时刻发生大量的缓存失效,导致瞬间大量的请求直接打到了数据库,可能会导致数据库瞬间压力过大甚至宕机.尤 ...
定时重启Nginx、MySql等服务
利用 Linux Crontab,每天定时重启 Nginx.MySQL等服务. 命令行格式说明 f1 f2 f3 f4 f5 program 其中 f1 是表示分钟,f2 表示小时,f3 表示一个月份 ...
Util应用框架核心(一) - 服务配置
本文介绍在项目中如何配置 Util 依赖服务. 文章分为多个小节,如果对设计原理不感兴趣,只需要阅读基础用法部分即可. 基础用法 Asp.Net Core 项目服务配置调用 WebApplicati ...