纯离线部署本地知识库LLM大模型
纯离线部署本地知识库LLM大模型
一、下载离线大模型
下载的网址:https://hf-mirror.com/
deepseek qwen 相关的模型,只建议使用1.5B的,GGUF后缀的模型
推荐下载llama相关模型,同样是GGUF后缀的,自己笔记本电脑推荐下载8B的

二、下载大模型管理平台 LM Studio
下载网址:https://lmstudio.ai/
安装过程只需要修改一个安装路径,后面一直下一步安装成功。
三、将离线大模型导入到 LM Studio 中
注意:默认情况下,LM Studio 所识别的大模型的目录在C盘
默认路径:C:\Users\用户名\.lmstudio\models

修改大模型的加载目录
- 先创建一个根目录 ,例如:F:\LMStudioModels
- 再创建一个二级目录,例如:F:\LMStudioModels\shujia_models 【必须要有一个二级目录】
- 将模型除.gguf意外的名字拷贝出来,当作一个文件夹的名字
- 将该模型放在这个文件夹里面
上面操作做完后,LM Studio就可以读取到我们的大模型。
四、通过LM Studio加载我们的大模型【重要,涉及GPU的能力】
- 点击对话正上方的
select a model to load,选择该对象要使用的大模型 - 参数解释:
- Context Length: 该模型一次最大可以加载多少个token
- 若是简单的问答,推荐4096
- 若是小红书文案,推荐10000以上
- 若是写作文,小说,推荐100000左右
- GPU Offload: 运行时,所占用的GPU显存,建议先给一半
- CPU Thread Pool Size: 拉满
- Evaluation Batch Size: 512
- 后面不动,都以推荐为准
- Context Length: 该模型一次最大可以加载多少个token
五、调整参数,进行对话
点击右上角实验室器皿图标,show settings,设置Preset,例如添加一个:数学家
理解为:将当前对话的大模型设置成一个固定的角色
设置System Prompt,形容一下这个数学家
六、使用AnythingLLM工具使用LM Studio中的模型,加载知识库
- 将LM Studio作为一个服务对外提供,让AnythingLLM连接上LM Studio
- 打开LM Studio点击左边的Developer
- 打开 Start Server按钮
- 再AnythingLLM中,点击聊天设置,配置LM Studio,选择,模型
七、提供API服务
- 在AnythingLLM中左下角点击open settings
- 点击工具
- 点击API密钥,生成密钥
纯离线部署本地知识库LLM大模型的更多相关文章
- arcgis api 4.x for js 离线部署
在我的GIS之家群里,经常遇到 webgis 开发新手们提问 arcgis api for js 如何本地离线部署,而不是直接调用在线的,因为在线模式依赖互联网以及网速环境因素,受到的限制影响比较大. ...
- ArcGIS for Server内置JS Viewer的离线部署和配置
很多情况下,在地图服务发布完毕后,我们往往利用 ArcGIS for Server内置的 JS Viewer来查看和检测所发布的地图服务是否满足我们的要求.具体操作如下: 点击开始 -> 所有程 ...
- [转帖]在 Kubernetes 离线部署 KubeSphere
在 Kubernetes 离线部署 KubeSphere https://kubesphere.io/docs/v2.0/zh-CN/installation/install-ks-offline/ ...
- CDH5.16.1集群企业真正离线部署
一.准备工作 1.离线部署主要分为三块: MySQL离线部署 CM离线部署 Parcel文件离线源部署 2.规划 节点 MySQL部署组件 Parcel文件离线源 CM服务进程 大数据组件 hadoo ...
- AutoCAD云产品平台ForgeViewer格式离线部署思路分析
背景 在上一篇博文中CAD图DWG解析WebGIS可视化技术分析总结提到,利用AutoCAD的自有云产品 Autodesk Forge,能在浏览器中渲染 3D 和 2D 模型数据,实现DWG图形的We ...
- 千亿参数开源大模型 BLOOM 背后的技术
假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,"一朝看尽长安花"似乎近在眼前 -- 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM ...
- TiDB在X86和ARM混合平台下的离线部署和升级
[是否原创]是 [首发渠道]TiDB 社区 背景 在之前我们团队发布了TiDB基于X86和ARM混合部署架构的文章:TiDB 5.0 异步事务特性体验--基于X86和ARM混合部署架构,最近有朋友问到 ...
- Cesium简介以及离线部署运行
Cesium简介 cesium是国外一个基于JavaScript编写的使用WebGL的地图引擎,一款开源3DGIS的js库.cesium支持3D,2D,2.5D形式的地图展示,可以自行绘制图形,高亮区 ...
- arcgis api for js入门开发系列一arcgis api离线部署
在我的GIS之家QQ群里,很多都是arcgis api for js开发的新手,他们一般都是GIS专业的学生,或者从计算机专业刚刚转向来的giser,他们难免会遇到各种webgis开发的简单问题,由于 ...
- Node服务一键离线部署
背景说明 项目测试通过,到了上线部署阶段.部署的机器安全限制比较严格,不允许访问外网.此外,没有对外网开放ssh服务,无法通过ssh远程操作. 针对上面提到的两条限制条件,通过下面方式解决: 无法访问 ...
随机推荐
- 对象存储 COS 推出一站式内容审核服务,助力打造绿色互联网
今年,国家网信办深入推进"清朗·春节网络环境"专项行动.截至3月24日,网信办共累计清理相关违法违规信息208万余条,处置账号7.2万余个,协调关闭.取消备案网站平台2300余家. ...
- 运筹帷幄,质效兼修:源启云原生基础设施管理平台助推企业IT基础资源能效跃迁
导语 数字化大潮席卷,企业需要建设一套能够满足云原生环境下基础资源一体化管理和快速交付的基础设施自动化管理系统,系统需要具备"云上""云下""容器&q ...
- d2js + activiti 备忘
很久没玩 activiti 了再摸起来都有点陌生了,梳理了一下要点如下: 1. d2js 作为业务端发起流程. d2js.exports.vocationRequest = d2js.vocation ...
- archlinux 显卡驱动
https://arch.icekylin.online/guide/rookie/graphic-driver.html archlinux 显卡驱动# 接天莲叶无穷碧,映日荷花别样红# 近年来,a ...
- docker保存、导入、导出和加载tar及其tar.gz
一.操作tar包1.save和load命令save命令 docker save [options] images [images...]示例 : docker save -o nginx.tar ng ...
- 更改 macOS 用户帐户和个人文件夹的名称
https://support.apple.com/zh-cn/HT201548 您可以对创建 macOS 用户帐户时命名的用户帐户和个人文件夹进行重命名. 您的 macOS 用户帐户名称和您个人 ...
- Qt音视频开发43-采集屏幕桌面并推流(支持分辨率/矩形区域/帧率等设置/实时性极高)
一.前言 采集电脑屏幕桌面并推流一般是用来做共享桌面.远程协助.投屏之类的应用,最简单入门的做法可能会采用开个定时器或者线程抓图,将整个屏幕截图下来,然后将图片传出去,这种方式很简单但是性能要低不少, ...
- Wasm在即时通讯IM场景下的Web端应用性能提升初探
本文由得物技术WWQ分享,原题"基于IM场景下的Wasm初探:提升Web应用性能",下文进行了排版和内容优化. 1.什么是Wasm Wasm,全称 WebAssembly,官网描述 ...
- IM技术分享:万人群聊消息投递方案的思考和实践
本文由融云技术团队原创分享,原题"技术实践丨万人群聊的消息分发控速方案",为使文章更好理解,内容有修订. 1.引言 传统意义上的IM群聊,通常都是像微信这样的500人群,或者QQ的 ...
- FormData接口调用
JAVA调用方式 JAVA原生实现 package com.hisense.demo.utils; import java.io.*; import java.net.HttpURLConnectio ...