技术背景

在前面的两篇文章中,分别介绍过Ubuntu上关于DeepSeek的部署以及Windows平台关于DeepSeek的部署。其中内容包含了Ollama的下载安装和基本使用、DeepSeek模型文件的下载,以及使用ChatBox导入Ollama本地模型进行本地对话的方法。这里再介绍一个使用AnythingLLM构建本地知识库的方法,本地知识库跟ChatBox两种对话模式的主要不同点在于,ChatBox对话中输入给大模型的其实是上下N条对话的内容,而本地知识库是先给大模型输入本地一系列的文件内容,然后再进行对话,这就是大模型领域专业化的一个重要应用。

下载安装AnythingLLM

这里我们仅介绍Windows平台的方案,首先访问AnythingLLM官网,找到一个适合自己本地环境的版本下载,Windows系统就直接安装就可以了:

由于安装过程中有可能要联网下载一些库,所以不能离线安装,而且要耗费一些时间。

AnythingLLM本地工作区配置

安装完成后打开界面是这样的:

选择第一个,点击->进入下一步:

中间可能还要填一些邮箱用途之类的,没什么影响,按情况填写然后继续点击->进入下一步:

输入工作区名称,就创建完成了:

我感觉这个对话框还是比ChatBox简洁很多,看个人吧,喜欢哪个就用哪个。

AnythingLLM模型配置

点击左下角的扳手图标,先配置一些基本参数:

模型配置在LLM首选项里边:

选择Ollama,然后剩下的按照自己的本地情况进行配置:

这里稍有点不同的是,ChatBox里面配置远程IP的时候,可以直接用xxx.xxx.xxx.xxx:11434这样的形式。但是在AnythingLLM里面配置远程ip的话,需要加上http,也就是http://xxx.xxx.xxx.xxx:11434这样的形式。然后就可以进入到聊天窗口,这里再修改一下工作区的模型配置:

这里就可以看到对应IP下的所有本地模型,配置完成后就可以开始对话了:

工作区上传知识库文档

在工作区那里有两个按钮,一个是上面一个章节用到的模型配置按钮,还有一个就是上传知识库文档的按钮了,点击可以进入这样的一个界面:

可以本地打开一个文件夹,把相应的文件拖到左下角那朵云上面,就上传到临时交换区了。这里还可以把网页链接输进去,也是直接同步到交换区。在传完文件之后,在交换区选择需要传输到工作区里面的文件,点击Move To Workspace就可以把所有选中的文件传到工作区里面了。这里还没结束,需要再点击一个Save and Embed同步到工作区中,这需要一点点解析的时间。传输完成后,可以在右侧工作区的文件面板上看到传输过来的文件,包含网页内容:

这样就可以构建属于自己专业领域的本地知识库了,相当于让DeepSeek的模型学习一遍这些传进去的文档。

应用场景

这里只是做一个简单的演示。我先在一个空白的工作区里面提问:“什么是mindsponge”。这个问题对于模型来说可能会有点陌生,因为它学习到的数据里面可能没有这个工具,所以它的回答也是不知所云:

但是当我把之前写过的一些关于mindsponge的博客传上去之后,再问一遍“什么是mindsponge”,它的回答是这样的:

相对来说信息就准确了很多,可以认为大模型从本地的知识库里面学习到了行业相关内容,这就完成了一个大模型+专业领域知识库的构建。

提示

这里提供1条可能有用的提示:载入新的知识库文件之后,最好reset一下对话,发送一个/reset即可。

总结概要

大模型之大,可以训练我们所有人日常生活学习工作可能使用到的所有知识。但是完整的大模型,要实现一个本地化的部署,可能是有点困难,因此才有了大模型的蒸馏技术。蒸馏之后大模型可能会损失大多数的行业知识,而我们可以通过本地知识库构建的方法,在本地构建一个私有的专业大模型。

版权声明

本文首发链接为:https://www.cnblogs.com/dechinphy/p/deepseek3.html

作者ID:DechinPhy

更多原著文章:https://www.cnblogs.com/dechinphy/

请博主喝咖啡:https://www.cnblogs.com/dechinphy/gallery/image/379634.html

参考链接

  1. https://readdevdocs.com/blog/ai/如何用DeepSeek R1搭建个人知识库?.html#前言

DeepSeek部署本地知识库的更多相关文章

  1. HTTP Error 502.5 - Process Failure Win10 VS可以正常访问,部署本地IIS报错

    最近本core得升级导致各种问题,之前刚解决了server2012的502.5问题 今天本机又出现这个问题. 情况描述:VS可以正常调试查看,部署本地IIS访问 错误502.5 分析:VS可以使用II ...

  2. 使用Minikube部署本地Kubernetes集群(二十八)

    前言 使用Minikube部署本地k8s集群相对比较简单,非常推荐将其用于本地k8s开发环境,唯一麻烦点的仅仅是网络问题. 在本篇教程中,我们使用了国内的镜像来完成本地k8s集群的搭建.如果搭建过程中 ...

  3. 使用vagrant一键部署本地php开发环境(二)制作自己的vagrant box

    在上篇的基础上 ,我们已经安装好了virtualbox和vagrant,没有安装的话,参照上篇 使用vagrant一键部署本地php开发环境(一) 1.从网易镜像或阿里等等镜像下载Centos7 ht ...

  4. Docker_部署本地镜像仓库(6)

    在部署本地镜像仓库之前,需要在主机上安装Docker.本地镜像仓库是registry镜像的一个实例,在Docker中运行. 1.创建本地镜像仓库服务 $ docker run -d -p 4000:5 ...

  5. PhpStorm 4.0 & 5.0 部署本地Web应用 (转)

    1.创建新的项目(project),创建完成之后单击工具栏的应用运行/调试(Select Run/Debug Configuration)的下拉菜单弹出 Edit Cofigurations选项,单击 ...

  6. PhpStorm 4.0 & 5.0 部署本地Web应用

    1.创建新的项目(project),创建完成之后单击工具栏的应用运行/调试(Select Run/Debug Configuration)的下拉菜单弹出 Edit Cofigurations选项,单击 ...

  7. 超实用!!!使用IDEA插件Alibaba Cloud Toolkit工具一键部署本地应用到ECS服务器

    最近看到阿里云发布了一款名为 Alibaba Cloud Toolkit 的插件,可以帮助开发者高效开发并部署适合在云端运行的应用,瞬间击中了我的小心脏,这个对于个人开发者来说超级棒啊,终于不需要再手 ...

  8. 为Kubernetes集群部署本地镜像仓库

    目录贴:Kubernetes学习系列 经过之前两篇文章:Centos7部署Kubernetes集群.基于kubernetes集群部署DashBoard,我们基本上已经能够在k8s的集群上部署一个应用了 ...

  9. 云服务器--linux系统操作命令以及安装ngnix记录,以及手动部署本地文件

    1.控制台登陆服务器,需要首先知道服务器ip和密码,,命令是 ssh root@1.1.1.1(服务器IP),然后输入密码登入服务器 2.查看linux 版本的系统命令是 cat /etc/redha ...

  10. php+wamp环境部署本地Web应用

    1.创建新的项目(project),创建完成之后单击工具栏的应用运行/调试(Select Run/Debug Configuration)的下拉菜单弹出 Edit Cofigurations选项,单击 ...

随机推荐

  1. An Entry Example of Log4j

    The log4j can be configured both programmatically and externally using special configuration files. ...

  2. PythonDay5Advance

    PythonDay5Advance 函数和模块 main函数要有,用户自己选择要做的功能,根据选择调用不同的函数 用户注册的信息需要使用一个文件存储,登录需要判断用户是否存在,密码是否正确 注册的时候 ...

  3. 13TB的StarRocks大数据库迁移过程

    公司有一套StarRocks的大数据库在大股东的腾讯云环境中,通过腾讯云的对等连接打通,通过dolphinscheduler调度datax离线抽取数据和SQL计算汇总,还有在大股东的特有的Flink集 ...

  4. uni-app onReachBottom钩子触发问题

    前情 uni-app是我很喜欢的跨平台框架,它能开发小程序,H5,APP(安卓/iOS),对前端开发很友好,自带的IDE让开发体验也很棒,公司项目就是主推uni-app. 最近有多个需求,页面滚动到底 ...

  5. OS之《进程管理》

    进程同步 同步实际上是指:将多个进程,按照顺序,有序执行. 让进程有序进行的场景有很多.比如:一个进程依赖另外一个进程的计算结果:一个进程等待另外一个对临界资源的访问:还有像生产者消费者模型中的相互配 ...

  6. 云数据备份 | CDN 日志备份最佳实践

    前言 ​ 内容分发网络(Content Delivery Network,CDN),是在现有 Internet 中增加的一层新的网络架构,可以有效降低用户访问延迟,提升可用性. CDN 按照小时粒度对 ...

  7. SafeHandle 和 Dispose

    SafeHandle 和 Dispose 这是从 https://www.cnblogs.com/zeroone/p/3708112.html 复制过来的,原文的格式不够好,重新排版一下. SafeH ...

  8. 【金TECH频道】从第一性原理出发,数字原生银行原来可以这样做

    ​ "第一性原理",是最近商界特别流行的一个词. 这个来自于古希腊先贤的古老词汇,本意在于更多聚焦于事物本质,即是用物理学的角度来看待世界,一层层拨开事物表象,看到里面的本质,再从 ...

  9. 【Java】【Maven】002 修改maven仓库的路径与配置阿里云镜像仓库

    [Java][Maven]001 下载与配置环境 - 萌狼蓝天 - 博客园 (cnblogs.com/mllt) 修改maven仓库的路径 maven指定的本地仓库的默认位置是在c盘,默认在:C:\U ...

  10. Linux查找某个大小范围内的文件

    查找大小在某个范围内的文件使用-size参数,-size +n表示大于n单位的范围,-size –n表示小于n单位的范围.例如,查找大于100k且小于400k的文件: find . -type f - ...