实操Deepseek本地创建知识库
之前写了一篇本地电脑部署Deepseek的文章,有些朋友问到如何给本地的Deepseek添加知识库,于是我又找时间学习了下。
现在把我的实操过程分享一下。这个是本地部署Deepseek的教程:https://www.cnblogs.com/LaiYun/p/18695293
- 下载安装Cherry-Studio
部署完本地Deepseek后就使用Cherry-Studio进行创建知识库,首先先下载Cherry-Studio,官网地址:https://cherry-ai.com/
我这里也提供一个百度云盘链接:https://pan.baidu.com/s/1jSD99Ls7IV6tgPJT3ZsRCg 提取码:1ba3
下载好后进行安装Cherry-Studio。
- 下载嵌入模型BGE-M3
进入Ollama官网:https://ollama.com/search,在Models搜索BGE
点击进入BGE后,点击复制下载命令
打开CMD终端命令,粘贴下载命令,回车下载
- 配置CherryStudio
打开CherryStudio客户端,点击设置-->打开Ollama-->选择模型
将Deepseek和BGE模型添加进去
- 添加本地知识库
添加知识库,嵌入模型有多个的话自己选择一个好用的就可以,这里示例是BGE-M3
将自己的本地文件添加到知识库中,这里除了可以添加文件,还可以设置本地的文件目录或者网址、网站、笔记等作为知识库的来源。
添加好本地知识库后,开始提问,我这里的测试知识库文件是txt的,内容也很少,提问小李的电话是多少。
选好知识库后一定要变亮了才是选择上了,亮了后就回车提问。
根据我的提问,模型从本地知识库中检索回答出来了正确答案。
到了这里可能会有人很兴奋,立马心血来潮就想建立一个自己的私有知识库,等等,先别急,我再给你看下另外一个测试效果。
这里我是用的信息管理工程师的官方教材,比如:这里信息化政策法规和标准规范6个要素,我就针对这个提问
这里我已经上传好了本地文件
提问:信息化政策法规和标准规范6个要素是什么?
发现回答的和本地知识库的没有一点关联性。看到这里很多人很失望,但是原因是什么呢?
不是大模型不行,而是你部署的大模型参数太低,比如我这个测试的大模型就是最小的1.5B的,所以他的智商就在那里。我看了网上其他一些人的测试,如果要效果比较好的,就需要32B或者70B的效果就会好很多,但是也不要期待值过高,本地版始终很难和Deepseek官方那个在线那么流畅和智能,即使你是用的671B的也是一样,因为这个还是需要专业人士不断地进行一些针对性的调优和校正。
当然如果是个人或者企业在资源充足以及要求隐私性比较强的情况下还是可以在本地部署一个32B以上的进行使用的,一些简单的需求它还是可以处理的,如果是671B全参数完整版,那还是很厉害的。还有Cherry-Studio这个工具还集成了很多其他的AI模型,如果你有API的话也可以调在线模型,或者你本地电脑下载了其他模型的话,也可以进行切换对应模型,具体功能大家可以自己摸索。
最后教程就到此结束啦,谢谢!
实操Deepseek本地创建知识库的更多相关文章
- Windows Azure 实操 —— 迁移本地SharePoint服务器到Azure
博客地址 http://blog.csdn.net/foxdave 注意:如果你是第二代虚拟机,那就别看这个了,老老实实在Azure上重新创建吧,Azure不支持第二代虚拟机. 写在之前,对Azure ...
- 网络编程:多进程实现TCP服务端并发、互斥锁代码实操、线程理论、创建线程的两种方式、线程的诸多特性、GIL全局解释器锁、验证GIL的存在
目录 多进程实现TCP服务端并发 互斥锁代码实操 线程理论 创建线程的两种方式 线程的诸多特性 GIL全局解释器锁 验证GIL的存在 GIL与普通互斥锁 python多线程是否有用 死锁现象 多进程实 ...
- 【实操日记】使用 PyQt5 设计下载远程服务器日志文件程序
最近通过 PyQt5 设计了一个下载服务器指定日期日志文件的程序,里面有些有意思的技术点,现在做一些分享. PyQt5 是一套 Python 绑定 Digia Qt5 应用的框架,是最强大的 GUI ...
- 新硬盘挂载-fdisk+mount案例实操
新硬盘挂载-fdisk+mount案例实操 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 现在很多服务器都支持热插拔了,当有新的硬盘插入到服务器上我们需要将其分区,格式化,然后挂载 ...
- Docker安装MySql完整教程、实操
docker:官网 docker:镜像官网: 镜像官网可以所有应用,选择安装环境:会给出安装命令,例如:docker pull redis 默认拉取最新的版本(指定版本:docker p ...
- Istio的流量管理(实操三)
Istio的流量管理(实操三) 涵盖官方文档Traffic Management章节中的egress部分.其中有一小部分问题(已在下文标注)待官方解决. 目录 Istio的流量管理(实操三) 访问外部 ...
- Hive中的数据类型以及案例实操
@ 目录 基本数据类型 集合数据类型 案例实操 基本数据类型 对于Hive的String类型相当于数据库的varchar类型,该类型是一个可变的字符串,不过它不能声明其中最多能存储多少个字符,理论上它 ...
- ubuntu 18.04 搭建flask服务器(大合集,个人实操)
ubuntu 18.04 搭建flask服务器(大合集) Ubuntu python flask 服务器 本次使用的Ubuntu版本为:Ubuntu 18.04.5 LTS (GNU/Linux 4. ...
- [Django框架 - 静态文件配置、request对象方法初识、 pycharm链接数据库、ORM实操增删改查、django请求生命周期]
[Django框架 - 静态文件配置.request对象方法初识. pycharm链接数据库.ORM实操增删改查.django请求生命周期] 我们将html文件默认都放在templates文件夹下 将 ...
- 72 个网络应用安全实操要点,全方位保护 Web 应用的安全
原文地址:Web Application Security Checklist 原文作者:Teo Selenius(已授权) 译者 & 校正:HelloGitHub-小熊熊 & 卤蛋 ...
随机推荐
- 一图归纳三大种类矩阵范数:诱导范数,元素范数,Schatten范数,涵盖谱范数,2范数
转载自:https://blog.csdn.net/qq_27261889/article/details/87902480
- COSBrowser 移动端——随时随地查看管理数据
外出身边没有电脑,需要查看管理数据怎么办? 出现紧急情况,需要快速停止某个 bucket 对外访问,怎么办? 个人用户仅作为网盘使用,需要方便轻量的管理工具,怎么办? 不用着急,COSBrowser ...
- Flutter 引用包命名冲突,重复引用
Flutter 引用包命名冲突,重复引用 报错信息 lib/page.dart:92:11: Error: 'Response' is imported from both 'package:get/ ...
- 【Python】【图像处理】图片压缩方法
一直想找个"无损压缩"的办法. 当然这并非真的无损. 我采用了Opencv的处理图像相关的方法. 请见代码: 注意: opencv安装:pip install opencv-pyt ...
- ctr命令的基本使用与技巧
k8s早1.24后放弃docker,并把containerd作为运行时组件,containerd 调用链更短,组件更少,更稳定,占用节点资源更少 ctr是containerd的一个客户端工具 cric ...
- python安装pip出现No package python-pip available
安装pip: 使用yum进行安装 yum install python-pip 1 若出现 No package python-pip available. 则解决方法如下: yum -y ins ...
- Anaconda下载安装及Spyder使用Python
第一:选择编程语言, C++ Java Python等,量化交易广泛使用Python开发策略. 第二:选择软件,Anaconda 或者 PyCharm,龙哥选用Anaconda,因为 Anaconda ...
- Qt/C++音视频开发75-获取本地有哪些摄像头名称/Qt内置函数方式
一.前言 在需要打开本地摄像头的场景中,有个需求绕不开,那就是如何获取本地有哪些摄像头设备名称,这样可以提供下拉框给用户选择,不然你让用户去填设备名,你觉得用户会知道是啥,他会操作吗?就算你提供了详细 ...
- Qt/C++音视频开发49-推流到各种流媒体服务程序
一.前言 最近将推流程序完善了很多功能,尤其是增加了对多种流媒体服务程序的支持,目前支持mediamtx.LiveQing.EasyDarwin.nginx-rtmp.ZLMediaKit.srs.A ...
- Qt项目升级到Qt6经验总结
1 直观总结 增加了很多轮子,同时原有模块拆分的也更细致,估计为了方便拓展个管理. 把一些过度封装的东西移除了(比如同样的功能有多个函数),保证了只有一个函数执行该功能. 把一些Qt5中兼容Qt4的方 ...