许多人对AI知识库的理解是:只需将所有资料拖入AI客户端(如Cherry Studio),AI便会自动阅读并生成完美结论。

但实际体验后,大家发现AI知识库效果远不如预期,经常出现各种问题。

技术原理与局限

本文将从原理出发,分析AI知识库的技术局限,并介绍进阶方案,如重排序模型、数据库(MCP server)和超长上下文模型等。

目前主流的大模型知识库采用RAG(检索增强生成)技术。

用户添加资料时,系统会先将其拆分为多个文本块。

随后,嵌入模型将这些文本块向量化,即将文本转为一组超长数字序列。

以我的知识库为例,嵌入模型输出1024维向量:

每个文本块都被转为1024个数值组成的向量:

系统将向量及对应文本存入向量数据库。

用户提问时,问题同样被向量化为1024维向量。

系统将问题向量与数据库中所有向量进行相似度计算,完全基于数学运算。

最终,知识库选出最相似的原文片段,与用户问题一同发送给大模型,由其归纳总结。

可见,在RAG架构中,大模型主要负责归纳总结,答复质量很大程度取决于检索精度。RAG系统普遍存在分块粗糙、检索不准、缺乏全局视角等问题。

Cherry Studio安装与配置

前往Cherry Studio官网下载并安装软件:Cherry Studio



安装过程简单,按提示操作即可。

安装后,打开软件,点击左下角“设置”-“模型服务”。

本文以硅基流动提供的免费嵌入模型为例。找到“硅基流动”,点击获取密钥。若无账号可先注册。



欢迎在评论区互助分享邀请码。

点击左侧“API密钥”,新建密钥(如“程序员NEO”),复制生成的密钥。





将密钥填入Cherry Studio。

添加嵌入模型:点击“模型”右侧添加按钮。

回到硅基流动“模型广场”,筛选“类型”为“嵌入”,选择“bge-m3(免费)”,复制模型名称。





回到Cherry Studio,填入模型名,点击“添加嵌入模型”完成配置。

知识库配置与文件添加

配置知识库:点击左侧“知识库”-“添加”,填写名称,选择刚添加的嵌入模型,点击确定。



添加文件:点击“添加文件”,选择文档(如《三国演义》),打开后自动处理。





分片已存入向量数据库。

根据官方文档,目前使用turso的libSQL数据库。

在知识库页面右上角点击“搜索知识库”可检索分片内容。

如搜索“刘备”,系统会基于向量匹配查找相关段落,每段约300字。

Cherry Studio采用long chain递归文本分割器。

RAG知识库的缺陷与改进

分块方式简单

这种分块方式基本按段落分块,段落过长则按固定字数切分,常导致句子被截断。

以刚检索到的“刘备”为例:

可见“:”前内容被截断,结尾“虽是”也未说完。由于分块上限为300字,前后句被强行截断。

这暴露了RAG知识库的缺陷:分块粗糙,AI难以理解上下文,导致回答不精准。

虽然也有基于语义分析的分块方法,但目前大多不成熟,效果甚至不如简单分割。

检索不精准

RAG的另一个问题是检索不准。例如搜索“曹操兵器”,想找倚天剑的信息。

系统仅基于数字相似度匹配,无法真正理解文本含义,筛选片段可能相关也可能无关,难以精准匹配。



匹配结果往往不是所需信息,这是RAG系统的痛点之一。

较好的改进方案是引入重排序模型。先用向量数据库初步检索,再用重排序模型做语义分析,根据相关性重新排序。



以“曹操兵器”为例,添加重排序模型后,效果明显提升。进入模型服务,找到硅基流动,添加重排序模型。





复制免费重排序模型名称,回到Cherry Studio添加。



在知识库设置中添加重排序模型,点击确定。



再次搜索“曹操兵器”,倚天剑信息排到第二位,分数78%。重排序模型显著提升了检索精度。

缺乏全局视角

第三个痛点是缺乏全局视角。以AI生成的300条学生统计数据为例:

如需统计分析(如最大最小值),RAG难以胜任。向量数据库只能匹配文本块,无法整体分析。

将Excel文件添加到知识库:

在聊天界面(使用DeepSeek,硅基流动提供),开启知识库。

提问“共有多少学生”,AI仅获取六个片段。

实际有300个学生。

AI却答120个。

因此,结构化或统计性问题建议用关系型数据库。现在可通过MCP让AI操作数据库,效果更佳。

数据库接入与配置

已将学生数据导入PostgreSQL数据库。

数据准备与导入

借助ChatGPT将Excel数据转为SQL语句,高效导入数据库。以下为效果截图,敏感信息已脱敏。



Cherry Studio环境配置

在Cherry Studio配置MCP server,使AI可访问数据库。进入设置,添加MCP服务器。

如出现红色感叹号,点击查看详情,按提示安装UV和Bun依赖。





安装完成后,编辑MCP配置。



数据库接入MCP Server

在MCP配置页面查找PostgreSQL MCP。可参考官方GitHub:PostgreSQL MCP

复制官方配置内容,粘贴到Cherry Studio。



postgresql://localhost/mydb 替换为自己的数据库地址,格式如下:

"postgresql://<user>:<password>@<host>:<port>/<database>"

示例(已脱敏):

postgresql://db_user:db_password@db-host.example.com:5432/dbname?sslmode=require
  • db_user:数据库用户名
  • db_password:密码
  • db-host.example.com:主机地址
  • 5432:端口(默认5432)
  • dbname:数据库名
  • sslmode=require:强制SSL加密

点击确定,启动服务。





系统提示词配置

回到聊天界面(需选择支持函数调用的模型,模型名后有扳手图标),选择刚配置的Postgres MCP服务器。

编辑系统提示词,先提供数据库表结构信息。

扩展两张表:课程表和选课成绩表。

你是数据库助手,以下是PostgreSQL表结构,请结合表结构和查询结果回答用户问题。

CREATE TABLE students (
id SERIAL PRIMARY KEY,
name VARCHAR(100),
age INTEGER,
phone VARCHAR(20),
gender VARCHAR(10)
); CREATE TABLE courses (
course_id INTEGER PRIMARY KEY,
course_name VARCHAR(100)
); CREATE TABLE enrollments (
id SERIAL PRIMARY KEY,
student_id INTEGER REFERENCES students(id),
course_id INTEGER REFERENCES courses(course_id),
score INTEGER
);

效果验证

保存后测试,如“学生总数是多少”。

AI可成功调用MCP server,通过SQL查询返回结果。需选择支持工具调用的模型。

再问“年龄最大的学生是谁”,同样查询成功。

测试复杂问题,如“哪些学生选修了数学课,分数最高前三名”。

AI可联合三表查询,准确返回结果。通过MCP server对接数据库,结构化数据检索效果远超普通知识库。

超长上下文模型的应用

此外,还可利用支持超长上下文的模型,将资料直接拖入对话框。

模型窗口进化与测试

如上图,近两年模型上下文窗口大幅提升。例如Gemini 2.0 Pro已支持2000万token,可容纳四大名著。以下以Gemini为例测试。

API密钥获取与模型配置

访问谷歌AI Studio(需魔法上网)。

右上角“Get API Key”,点击创建API密钥。







复制API密钥。

回到Cherry Studio,设置模型服务商为Gemini,填写API密钥。

添加模型,点击“添加”,模型ID可在AI Studio选择。以Gemini 2.0 Flash为例,支持100万token上下文,且有免费额度。

复制Gemini 2.0 Flash模型ID。

回到Cherry Studio,填写模型ID并添加。

切换聊天模型为Gemini 2.0 Flash。

清空助手默认Prompt。

知识库检索实战

测试知识库能力。以全本《三国演义》为例,用VSCode将张飞武器改为“丈九棒棒糖”,保存。

将全本《三国演义》拖入对话框,提问:“张飞造了什么兵器,请找到原文位置并据此回答。”

AI成功检索到答案,第一回中张飞造“丈九棒棒糖”。本次任务消耗551266 token。

整个《三国演义》仅用了一半上下文窗口。利用Gemini超长上下文进行知识库检索,效率极高。

总结与展望

AI知识库常被称为“demo五分钟,上线一年”。目前AI知识库仍是复杂系统工程,无通用银弹,项目落地需多工具协作。当前效果较好的方案是自适应RAG,根据查询类型自动选择检索策略,结合多种方式提升精度。本文到此结束.

推荐阅读:

主题 链接
零成本部署:5分钟创建免费PostgreSQL数据库 点击阅读
AI知识库的真相 点击阅读
Cherry Studio 本地知识库搭建教程 点击阅读
RAG知识库痛点与优化 点击阅读
数据库接入大模型实战 点击阅读

解密AI知识库的更多相关文章

  1. 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退

    AI早期成就,相对朴素形式化环境,不要求世界知识.如IBM深蓝(Deep Blue)国际象棋系统,1997,击败世界冠军Garry Kasparov(Hsu,2002).国际象棋,简单领域,64个位置 ...

  2. 释放至强平台 AI 加速潜能 汇医慧影打造全周期 AI 医学影像解决方案

    基于英特尔架构实现软硬协同加速,显著提升新冠肺炎.乳腺癌等疾病的检测和筛查效率,并帮助医疗科研平台预防"维度灾难"问题 <PAGE 1 LEFT COLUMN: CUSTOM ...

  3. 监督学习,无监督学习常用算法集合总结,引用scikit-learn库(监督篇)

    why写这篇blog 最近在接触这方面的知识,但是找了许多的笔记,都感觉没有很好的总结出来,也正好当做是边学习,边复习着走.大佬轻喷.参考书目<python机器学习基础教程> 将分别从以下 ...

  4. 解密优酷智能生产技术,看 AI 赋能内容数字化

    2021 年,随着社会节奏的加快,用户碎片化消费时间不断增加,当前短视频的消费用户规模已超 7.73 亿人,短视频的市场规模超过 2000 亿元.短视频行业发展迅速,但也存在低质内容泛滥,精品内容稀缺 ...

  5. 技术解密 |阿里云多媒体 AI 团队拿下 CVPR2021 5 冠 1 亚成绩的技术分享

    6 月 19-25 日,备受全球瞩目的国际顶级视觉会议 CVPR2021(Computer Vision and Pattern Recognition,即国际机器视觉与模式识别)在线上举行,但依然人 ...

  6. CANN5.0黑科技解密 | 别眨眼!缩小隧道,让你的AI模型“身轻如燕”!

    摘要:CANN作为释放昇腾硬件算力的关键平台,通过深耕先进的模型压缩技术,聚力打造AMCT模型压缩工具,在保证模型精度前提下,不遗余力地降低模型的存储空间和计算量. 随着深度学习的发展,推理模型巨大的 ...

  7. 【将门创投】AI 往期技术分享

    计算机视觉 1. 嘉宾:商汤科技CEO 徐立 文章回顾:计算机视觉的完整链条,从成像到早期视觉再到识别理解 2. 嘉宾:格灵深瞳CTO 赵勇 文章回顾:计算机视觉在安防.交通.机器人.无人车等领域的应 ...

  8. 【RPA之家转载】苏桦 华为RPA 企业财务实践:RPA与AI结合,实现百万级票据、合同处理自动化

    [RPA之家转载]苏桦 华为RPA 企业财务实践:RPA与AI结合,实现百万级票据.合同处理自动化 看到大会的主题,说每一位开发者都了不起,说白了我也非常的感触,因为我自己本身也是一个开发者,我从01 ...

  9. [知识库分享系列] 四、ASP.NET MVC and Winform

    知识库分享系列: [知识库分享系列] 三.Web(高性能Web站点建设) [知识库分享系列] 二..NET(ASP.NET) [知识库分享系列] 一.开篇 分享介绍本篇分享两个知识库节点,分别为“AS ...

  10. [知识库分享系列] 二、.NET(ASP.NET)

    最近时间又有了新的想法,当我用新的眼光在整理一些很老的知识库时,发现很多东西都已经过时,或者是很基础很零碎的知识点.如果分享出去大家不看倒好,更担心的是会误人子弟,但为了保证此系列的完整,还是选择分享 ...

随机推荐

  1. 【忍者算法】从十字路口相遇到链表交点:探索相交链表问题|LeetCode第160题 相交链表

    从十字路口相遇到链表交点:探索相交链表问题 生活中的相遇问题 想象两个人从不同的地方出发,最后在一个十字路口相遇.他们可能走过不同长度的路程,但最终会在同一个点汇合.这就很像我们今天要讨论的相交链表问 ...

  2. python - [12] 脚本一文通

    题记部分 一.文件夹&文件 (1)删除空文件夹 # 删除目录中的空文件夹 import os def move_epty_folders(directory_path): for root, ...

  3. MySQL - [07] 查看库表数据所使用的空间大小

    1.切换数据库:use information_schema; 2.查看数据库使用大小 SELECT concat(round(sum(data_length/1024/1024),2),'MB') ...

  4. Zookeeper - 本地模式部署

    本地模式部署 zoo.cfg 参数解析 本地模式部署 1.上传zookeeper的安装包并解压 tar -zxvf zookeeper-x.x.x.tar.gz -c /xxx/xxx/ 2.将 zo ...

  5. 将DeepSeek接入人类大脑会怎样??

    昨天在与同事聊起最近大火的DeepSeek, 突然,有一个不切实际的想法,如果DeepSeek或人工智能AI能以某种形式接入人类大脑, 比如,通过芯片不侵入式连接大脑 或者 外带什么眼镜. 隐形眼镜之 ...

  6. 基于项目的协同过滤推荐算法(Item-Based Collaborative Filtering Recommendation Algorithms)

    前言 协同过滤推荐系统,包括基于用户的.基于项目的息肉通过率等,今天我们读一篇基于项目的协同过滤算法的论文. 今天读的论文为一篇名叫<基于项目的协同过滤推荐算法>(Item-Based C ...

  7. [AI/GPT/LLOps/AI中台] Dify : 开源AI大模型应用开发平台(Apache 2.0)

    概述:Dify Dify 是一款开源的大语言模型(LLM) 应用开发平台. 它融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI ...

  8. C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)

    前言 C#/.NET/.NET Core技术前沿周刊,你的每周技术指南针!记录.追踪C#/.NET/.NET Core领域.生态的每周最新.最实用.最有价值的技术文章.社区动态.优质项目和学习资源等. ...

  9. leaflet生成地图封装成jquery插件使用

    公司业务里一直都有使用leaflet地图插件来做地图展示.绘图等操作.公司有个项目已经有好几年了,由于项目原因一直在使用,今年由于google 地图 api过期,导致已经使用的地图无法加载.我作为现在 ...

  10. [Qt 基础-01] QPushButton

    QPushButton 简介 QPushButton是一个很常用的一个按钮控件,主要用于创建一个可按压的按键.它显示了一 个文本和一个图标.另外,你也可以在创建时,指定一个快捷键. 基本用法 1. 创 ...