RAG 已经成为 LLM 大语言模型在企业落地的最佳方案,其中主要是因为 RAG 能够解决幻觉问题、时效性问题以及数据安全问题。

  • 解决幻觉问题

    LLM 文本生成的底层原理是基于概率的 token by token 的形式,因此会不可避免地

    产生“一本正经的胡说八道"的情况。比如:你说,”博物馆下周一开门吗?“,很有可能给你回复:”开门”,到时候就是白跑一趟了。
  • 解决时效性问题

    LLM 的规模越大,大模型训练的成本越高,周期也就越长。那么具有时效性的数据也就无法参与训练,所以也就无法直接回答时效性相关的问题,例如“帮我推荐几部热映的电影?”
  • 解决数据安全问题

    通用 LLM 没有企业内部数据和用户数据,那么企业想要在保证安全的前提下使用 LLM,最好的方式就是把数据全部放在本地,企业数据的业务计算全部在本地完成。而在线的大模型仅仅完成一个归纳的功能。

一、RAG 检索增强生成技术

“Retrieval-Augmented Generation” 的缩写,中文可以翻译为“检索增强生成”。这是一种结合了检索(Retrieval)和生成(Generation)的自然语言处理技术,用于提高语言模型在特定任务上的性能和准确性。在加上一个数据向量和索引的工作,我们对RAG就可以总概方式地理解为“ 索引、检索和生成 ”。

  • 索引(Indexing):

    将外部知识源(如文档、文章或数据库)转换为一种便于快速检索的结构化形式,并通过向量化(embedding)来实现。
  • 检索(Retrieval):

    在这个阶段,模型会从预先构建的大规模数据集中检索出与当前任务最相关的信息。这些数据集可以是文档、网页、知识库等。
  • 生成(Generation):

    在检索到相关信息后,模型会使用这些信息来生成答案或完成特定的语言任务。这个阶段通常涉及到序列生成技术,如基于Transformer的模型。

二、RAG的优势以及适用场景

  • 知识增强:通过检索外部知识源,生成模型可以访问更多信息,从而生成更准确的回答。
  • 可解释性:检索到的文档片段可以作为生成回答的依据,提高模型的可解释性。
  • 动态更新:外部知识源可以随时更新,而无需重新训练生成模型。

三、RAG 检索增强生成技术实现流程及最佳落地方案 MaxKB 的 RAG 原理解析

基于 RAG 的检索增强生成技术详细实现流程,我们可以逐一看下基于MaxKB ,一款基于大语言模型和RAG技术的开源知识库问答系统,是如何在企业落地大语言模型的外挂 RAG 技术,以下分为九点一一详细介绍:

3.1 基于 RAG 的 MaxKB 设计一:MaxKB 知识库文档管理

  1. 支持本地文档、Web 网站知识库文档。
  2. 支持 TXT、Markdown、PDF、DOCX、HTML、XLS、XLSX、CSV、ZIP等文档,同时支持表格数据以及 QA 问答等文档数据直接导入。

3.2 基于 RAG 的 MaxKB 设计二:MaxKB 文档智能化处理

  1. 支持智能文档分段:不了解如何设置分段规则时可使用智能分段;
  2. 支持高级分段:用户可根据文档规范自行设置分段标识符、分段长度及清洗规则;
  3. 支持导入时添加分段标题为关联问题:适用于标题为问题的问答对。

2.3 基于 RAG 的 MaxKB 设计三:MaxKB 支持自定义向量模型

  1. MaxKB 内置向量模型模型为 Text2vec-base-Chinese
  2. 支持自定义添加本地和公有向量模型;
  3. 目前支持公有模型包含阿里云百炼、Amazon Bedrock、Azure OpenAI、Gemini、OpenAI、SILICONFLOW、腾讯混元、千帆大模型、讯飞星火等,本地向量模型包含Ollama、Xorbits Inference等。

3.4 基于 RAG 的 MaxKB 设计四:用户提问问题优化完善

  1. 支持工作流编排增加问题优化节点;
  2. 支持语音提问以及表单搜集、文件上传等补充完善提问;
  3. 支持设置提问角色以及提示词并能够基于大语言模型进行问题优化;
  4. 支持将优化后的问题输出到知识库检索;
  5. 支持通过函数获取更多信息补充完善问题。

3.5 基于 RAG 的 MaxKB 设计五:支持向量数据库检索参数自定义

1、支持向量数据库检索自定义设置检索模式:向量检索、全文检索、混合检索;

2、支持设置检索相似度、引用分段数 TOP以及最多应用字符数;

3、支持设置知识库检索不到时是否咨询大模型等参数设置。

3.6 基于 RAG 的 MaxKB 设计六:支持自定义工作流基于重排模型进行多路召回

  1. 支持添加本地和公有重排模型;
  2. 支持公有模型包含阿里云百炼、SILICONFLOW等,本地向量模型包含Xorbits Inference等;
  3. 支持基于工作流编排添加多路召回节点,通过设置重排内容以及重排模型重新输出重排结果。

3.7 基于 RAG 的 MaxKB 设计七:知识库检索结果输出为AI对话提示词

  1. 支持将知识库搜索结果的分段列表输出作为 AI 对话提示词;
  2. 支持将用户提问问题作为 AI 对话提示词;
  3. 支持将定义 AI 节点扮演角色。

3.8 基于 RAG 的 MaxKB 设计八:模型中立,支持主流的公有和本地大语言模型

  1. 支持添加本地和公有大语言、语言识别、语音生成、视觉模型以及图片生成模型;
  2. 模型管理用于对接供应商的大语言模型,支持对接主流的大模型,包括本地私有大模型(Llama 3 / Qwen 2 等)、国内公共大模型( DeepSeek / SILICONFLOW / Kimi / 通义千问 / 智谱 AI / 百度千帆 等)和国外公共大模型(OpenAI / Azure OpenAI / Anthropic / Gemini 等),支持的类型包括文本生成、向量模型、重排、语音识别、语音合成、视觉模型、图片生成等。

3.9 基于 RAG 的 MaxKB 设计九:支持 AI 智能回答以及指定答复

  1. 支持大语言模型智能回答;
  2. 支持通过判断器让回答更加准确;
  3. 支持通过语音合成模型实现语言答复;
  4. 支持通过函数、内置标签等方式展示为不同格式的答复:图片、表格、图标、网页标签、文档等。

基于以上,MaxKB 基于大语言模型和检索增强生成 RAG 技术,为企业和个人提供了高效的知识管理和智能问答功能。MaxKB 支持多种文件格式的知识库导入,并配备了直观的 UI 界面进行模型配置和知识库管理。其内置的强大工作流引擎和函数库,能够支持复杂业务场景下的 AI 工作过程编排。此外,MaxKB 还支持将知识库问答系统无缝嵌入到第三方业务系统中,满足了企业多样化的需求。通过 MaxKB,用户可以轻松创建和管理知识库,实现快速且准确的知识检索和问答,是 RAG技 术的一个实用且高效的落地方案。

关于 MaxKB 更多资料及案例参见如下:

  1. MaxKB官网:https://maxkb.cn/index.html
  2. GitHub地址:https://github.com/1Panel-dev/MaxKB
  3. BBS论坛:https://bbs.fit2cloud.com/c/mk/11
  4. 培训认证中心:https://edu.fit2cloud.com/

【最佳方案】RAG 技术深度剖析及 MaxKB 在企业 AI 落地中的应用策略的更多相关文章

  1. 华为全栈AI技术干货深度解析,解锁企业AI开发“秘籍”

    摘要:针对企业AI开发应用中面临的痛点和难点,为大家带来从实践出发帮助企业构建成熟高效的AI开发流程解决方案. 在数字化转型浪潮席卷全球的今天,AI技术已经成为行业公认的升级重点,正在越来越多的领域为 ...

  2. 《AngularJS深度剖析与最佳实践》简介

    由于年末将至,前阵子一直忙于工作的事务,不得已暂停了微信订阅号的更新,我将会在后续的时间里尽快的继续为大家推送更多的博文.毕竟一个人的力量微薄,精力有限,希望大家能理解,仍然能一如既往的关注和支持sh ...

  3. WCF技术剖析之十九:深度剖析消息编码(Encoding)实现(下篇)

    原文:WCF技术剖析之十九:深度剖析消息编码(Encoding)实现(下篇) [爱心链接:拯救一个25岁身患急性白血病的女孩[内有苏州电视台经济频道<天天山海经>为此录制的节目视频(苏州话 ...

  4. CDN高级技术专家周哲:深度剖析短视频分发过程中的用户体验优化技术点

    深圳云栖大会已经圆满落幕,在3月29日飞天技术汇-弹性计算.网络和CDN专场中,阿里云CDN高级技术专家周哲为我们带来了<海量短视频极速分发>的主题分享,带领我们从视频内容采集.上传.存储 ...

  5. [转帖]深度剖析一站式分布式事务方案 Seata-Server

    深度剖析一站式分布式事务方案 Seata-Server https://www.jianshu.com/p/940e2cfab67e 金融级分布式架构关注 22019.04.10 16:59:14字数 ...

  6. [转帖]首颗国产DRAM芯片的技术与专利,合肥长鑫存储的全面深度剖析

    首颗国产DRAM芯片的技术与专利,合肥长鑫存储的全面深度剖析 https://mp.weixin.qq.com/s/g_gnr804q8ix4b9d81CZ1Q 2019.11 存储芯片已经成为全球珍 ...

  7. DDOS学习笔记(《破坏之王-DDOS攻击与防范深度剖析》)

           最近花了点时间把<破坏之王-DDOS攻击与防范深度剖析>看了一遍,坦白来说,这本书比较浅显,可以说是入门书,当然对于我这种对DDOS一知半解的人来说,也是一本不错的书,起码我 ...

  8. [Android] Toast问题深度剖析(二)

    欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 作者: QQ音乐技术团队 题记 Toast 作为 Android 系统中最常用的类之一,由于其方便的api设计和简洁的交互体验,被我们所广泛采用 ...

  9. Java_深度剖析ConcurrentHashMap

    本文基于Java 7的源码做剖析. ConcurrentHashMap的目的 多线程环境下,使用Hashmap进行put操作会引起死循环,导致CPU利用率接近100%,所以在并发情况下不能使用Hash ...

  10. QQ现状深度剖析:你还认为QQ已经被微信打败了吗?

    本文来自“人人都是产品经理”公众号作者栗栗粥的原创分享. 1.前言   移动端的时代里,微信占据了社交领域的半壁江山,不得不让人想起曾经PC时代里的王者“QQ”,微信的爆发和QQ的停滞让很多人认为微信 ...

随机推荐

  1. 使用C#获取文件详情

    有对应的需求,需要获取文件的详细信息内容.该页面信息大部分来源于文件的版本信息,使用FileInfo类并不能获取到. VERSIONINFO 资源 - Win32 apps | Microsoft L ...

  2. uni-app项目button组件去不掉的灰色边框爬坑

    前情 uni-app是我比较喜欢的跨平台框架,它能开发小程序/H5/APP(安卓/iOS),重要的是对前端开发友好,自带的IDE让开发体验非常棒,公司项目就是主推uni-app. 坑位 最近在开发个人 ...

  3. OpenID Connect 验证

    OpenID Connect Authentication 几乎所有的 Web 应用程序都提示用户创建账号并登录.为了创建账号,用户被要求提供他们的名字.电子邮件.口令.以及确认口令.不仅这些需要耗费 ...

  4. Linux FTP 服务搭建

    Linux FTP 服务搭建 1.安装vsftp 1.1.使用yum进行安装vsftp [root@localhost ~]# yum -y install vsftpd 1.2.配置文件目录 [ro ...

  5. Nginx日志重定向到标准输出

    背景静态站点使用`docker`部署时,希望`nginx前台启动`的同时可以将错误日志和访问日志全部重定向到标准输出,便于采集和处理! 实现只需要修改`nginx.conf`中`3行`关于日志的配置就 ...

  6. Debian关闭防火墙命令详解

    防火墙是保护计算机系统安全的关键组件.在一些情况下,需要关闭防火墙,以允许特定的应用程序或服务访问网络.在Debian系统中关闭防火墙的方法多种多样,本文将从多个方面对Debian关闭防火墙命令进行详 ...

  7. Qt编写视频监控系统72-通过onvif增删改查OSD

    一.前言 之前监控系统中原创的onvif协议解析机制,已经能够满足绝大部分用户的需要,比如搜索设备.获取视频流地址并播放.云台控制.预置位管理.图片亮度色彩饱和度等参数设置等,近期又多了一个需求,那就 ...

  8. UML之包与包图

    了解UML的人都知道UML中也有包的概念,包在UML中作用与面向对象编程语言中类似,它是管理对象的工具,也是解决对象同名冲突的手段. 在UML中,包的表示图形是一个左上角带标签的矩形,而包名可以标注于 ...

  9. 做一个windos服务和api搭配,获取电脑的mac地址

    创建webapi项目,只是搭配服务用,什么三层mvc都不弄了,默认的模板直接用就好. 简单分析下,采用signalr通信来传递mac地址,所以先安装个signalr的包(如果简单操作的话可以不装最新的 ...

  10. 昔日移动端IM明星 “米聊” 即将停止服务

    2021年1月19日,小米旗下米聊宣布,将于2021年2月19日12点停止米聊的服务. 1.以下消息来自米聊官网   2.关于米聊 米聊是小米科技出品的一款免费即时通讯工具,推出时间为:2010年12 ...