纯离线部署本地知识库LLM大模型
纯离线部署本地知识库LLM大模型
一、下载离线大模型
下载的网址:https://hf-mirror.com/
deepseek qwen 相关的模型,只建议使用1.5B的,GGUF后缀的模型
推荐下载llama相关模型,同样是GGUF后缀的,自己笔记本电脑推荐下载8B的

二、下载大模型管理平台 LM Studio
下载网址:https://lmstudio.ai/
安装过程只需要修改一个安装路径,后面一直下一步安装成功。
三、将离线大模型导入到 LM Studio 中
注意:默认情况下,LM Studio 所识别的大模型的目录在C盘
默认路径:C:\Users\用户名\.lmstudio\models

修改大模型的加载目录
- 先创建一个根目录 ,例如:F:\LMStudioModels
- 再创建一个二级目录,例如:F:\LMStudioModels\shujia_models 【必须要有一个二级目录】
- 将模型除.gguf意外的名字拷贝出来,当作一个文件夹的名字
- 将该模型放在这个文件夹里面
上面操作做完后,LM Studio就可以读取到我们的大模型。
四、通过LM Studio加载我们的大模型【重要,涉及GPU的能力】
- 点击对话正上方的
select a model to load,选择该对象要使用的大模型 - 参数解释:
- Context Length: 该模型一次最大可以加载多少个token
- 若是简单的问答,推荐4096
- 若是小红书文案,推荐10000以上
- 若是写作文,小说,推荐100000左右
- GPU Offload: 运行时,所占用的GPU显存,建议先给一半
- CPU Thread Pool Size: 拉满
- Evaluation Batch Size: 512
- 后面不动,都以推荐为准
- Context Length: 该模型一次最大可以加载多少个token
五、调整参数,进行对话
点击右上角实验室器皿图标,show settings,设置Preset,例如添加一个:数学家
理解为:将当前对话的大模型设置成一个固定的角色
设置System Prompt,形容一下这个数学家
六、使用AnythingLLM工具使用LM Studio中的模型,加载知识库
- 将LM Studio作为一个服务对外提供,让AnythingLLM连接上LM Studio
- 打开LM Studio点击左边的Developer
- 打开 Start Server按钮
- 再AnythingLLM中,点击聊天设置,配置LM Studio,选择,模型
七、提供API服务
- 在AnythingLLM中左下角点击open settings
- 点击工具
- 点击API密钥,生成密钥
纯离线部署本地知识库LLM大模型的更多相关文章
- arcgis api 4.x for js 离线部署
在我的GIS之家群里,经常遇到 webgis 开发新手们提问 arcgis api for js 如何本地离线部署,而不是直接调用在线的,因为在线模式依赖互联网以及网速环境因素,受到的限制影响比较大. ...
- ArcGIS for Server内置JS Viewer的离线部署和配置
很多情况下,在地图服务发布完毕后,我们往往利用 ArcGIS for Server内置的 JS Viewer来查看和检测所发布的地图服务是否满足我们的要求.具体操作如下: 点击开始 -> 所有程 ...
- [转帖]在 Kubernetes 离线部署 KubeSphere
在 Kubernetes 离线部署 KubeSphere https://kubesphere.io/docs/v2.0/zh-CN/installation/install-ks-offline/ ...
- CDH5.16.1集群企业真正离线部署
一.准备工作 1.离线部署主要分为三块: MySQL离线部署 CM离线部署 Parcel文件离线源部署 2.规划 节点 MySQL部署组件 Parcel文件离线源 CM服务进程 大数据组件 hadoo ...
- AutoCAD云产品平台ForgeViewer格式离线部署思路分析
背景 在上一篇博文中CAD图DWG解析WebGIS可视化技术分析总结提到,利用AutoCAD的自有云产品 Autodesk Forge,能在浏览器中渲染 3D 和 2D 模型数据,实现DWG图形的We ...
- 千亿参数开源大模型 BLOOM 背后的技术
假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,"一朝看尽长安花"似乎近在眼前 -- 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM ...
- TiDB在X86和ARM混合平台下的离线部署和升级
[是否原创]是 [首发渠道]TiDB 社区 背景 在之前我们团队发布了TiDB基于X86和ARM混合部署架构的文章:TiDB 5.0 异步事务特性体验--基于X86和ARM混合部署架构,最近有朋友问到 ...
- Cesium简介以及离线部署运行
Cesium简介 cesium是国外一个基于JavaScript编写的使用WebGL的地图引擎,一款开源3DGIS的js库.cesium支持3D,2D,2.5D形式的地图展示,可以自行绘制图形,高亮区 ...
- arcgis api for js入门开发系列一arcgis api离线部署
在我的GIS之家QQ群里,很多都是arcgis api for js开发的新手,他们一般都是GIS专业的学生,或者从计算机专业刚刚转向来的giser,他们难免会遇到各种webgis开发的简单问题,由于 ...
- Node服务一键离线部署
背景说明 项目测试通过,到了上线部署阶段.部署的机器安全限制比较严格,不允许访问外网.此外,没有对外网开放ssh服务,无法通过ssh远程操作. 针对上面提到的两条限制条件,通过下面方式解决: 无法访问 ...
随机推荐
- COS 音视频实践|给你的视频加把锁
导语 为了保障视频内容安全,防止视频被非法下载和传播,对象存储(Cloud Object Storage,COS)数据处理基于数据万象 CI 提供了 HLS 视频加密的功能,拥有相比于私有读文件更高的 ...
- IOS实现水波纹
IOS实现水波纹 需要实现一个水波纹效果 其实就是画两个正弦函数或者余弦函数的layer在view上面,根据屏幕刷新率来重绘,更新其左右偏移量来让其看起来是在左右移动 具体实现 定义两个layer,用 ...
- Qt编写视频监控系统78-视频推流到流媒体服务器
一.前言 视频推流作为独立的模块,目前并没有集成到视频监控系统中,目前是可以搭配监控系统一起使用,一般是将添加好的摄像头通道视频流地址打开后,读取视频流重新推到流媒体服务器,然后第三方可以从流媒体服务 ...
- 创建springboot项目时出现Selected Java version 11 is not supported by SDK (maximum 8)
创建springboot项目的时候出现这个问题: selected java version 11 is not supporteed Max supported version is(1.8) 错误 ...
- RAG实践 - AI 知识库问答功能的建设
最近在工作中构建了一套自动的基于文档中心为数据集构建知识库 AI 问答的系统,来提升用户体验和技术支持效率,分享一下在实现过程中的技术选型和架构设计. 背景 先说下背景,我们公司的产品 FinClip ...
- 【狂神说Java】Java零基础学习笔记-Java基础
[狂神说Java]Java零基础学习笔记-Java基础 Java基础01:注释 平时我们编写代码,在代码量比较少的时候,我们还可以看懂自己写的,但是当项目结构一旦复杂起来,我们就需要用到注释了. 注释 ...
- JVM实战—8.如何分析jstat统计来定位GC
大纲 1.使用jstat了解线上系统的JVM运行状况 2.使用jmap和jhat了解线上系统的对象分布 3.如何分析JVM运行状况并合理优化 4.使用jstat分析模拟的BI系统JVM运行情况 5.使 ...
- 微信小程序开发基础详解
1.结构 util.js 工具类 app.js 全局工具函数 app.json 小程序配置 app.wxss 全局样式 2.生命周期 onLoad(opt ...
- 如何快速的开发一个完整的iOS直播app(采集篇)
作者:袁峥链接:https://www.jianshu.com/p/c71bfda055fa来源:简书著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 开发一款直播app,首先需要 ...
- mac文件目录结构
详解MAC硬盘中各个文件夹 详解MAC硬盘中各个文件夹 打开Macintosh HD你会发现内中有四个文件夹 分别有--应用程序(Applications).系统(System).用户(User).资 ...