纯离线部署本地知识库LLM大模型
纯离线部署本地知识库LLM大模型
一、下载离线大模型
下载的网址:https://hf-mirror.com/
deepseek qwen 相关的模型,只建议使用1.5B的,GGUF后缀的模型
推荐下载llama相关模型,同样是GGUF后缀的,自己笔记本电脑推荐下载8B的
二、下载大模型管理平台 LM Studio
下载网址:https://lmstudio.ai/
安装过程只需要修改一个安装路径,后面一直下一步安装成功。
三、将离线大模型导入到 LM Studio 中
注意:默认情况下,LM Studio 所识别的大模型的目录在C盘
默认路径:C:\Users\用户名\.lmstudio\models
修改大模型的加载目录
- 先创建一个根目录 ,例如:F:\LMStudioModels
- 再创建一个二级目录,例如:F:\LMStudioModels\shujia_models 【必须要有一个二级目录】
- 将模型除.gguf意外的名字拷贝出来,当作一个文件夹的名字
- 将该模型放在这个文件夹里面
上面操作做完后,LM Studio就可以读取到我们的大模型。
四、通过LM Studio加载我们的大模型【重要,涉及GPU的能力】
- 点击对话正上方的
select a model to load
,选择该对象要使用的大模型 - 参数解释:
- Context Length: 该模型一次最大可以加载多少个token
- 若是简单的问答,推荐4096
- 若是小红书文案,推荐10000以上
- 若是写作文,小说,推荐100000左右
- GPU Offload: 运行时,所占用的GPU显存,建议先给一半
- CPU Thread Pool Size: 拉满
- Evaluation Batch Size: 512
- 后面不动,都以推荐为准
- Context Length: 该模型一次最大可以加载多少个token
五、调整参数,进行对话
点击右上角实验室器皿图标,show settings,设置Preset,例如添加一个:数学家
理解为:将当前对话的大模型设置成一个固定的角色
设置System Prompt,形容一下这个数学家
六、使用AnythingLLM工具使用LM Studio中的模型,加载知识库
- 将LM Studio作为一个服务对外提供,让AnythingLLM连接上LM Studio
- 打开LM Studio点击左边的Developer
- 打开 Start Server按钮
- 再AnythingLLM中,点击聊天设置,配置LM Studio,选择,模型
七、提供API服务
- 在AnythingLLM中左下角点击open settings
- 点击工具
- 点击API密钥,生成密钥
纯离线部署本地知识库LLM大模型的更多相关文章
- arcgis api 4.x for js 离线部署
在我的GIS之家群里,经常遇到 webgis 开发新手们提问 arcgis api for js 如何本地离线部署,而不是直接调用在线的,因为在线模式依赖互联网以及网速环境因素,受到的限制影响比较大. ...
- ArcGIS for Server内置JS Viewer的离线部署和配置
很多情况下,在地图服务发布完毕后,我们往往利用 ArcGIS for Server内置的 JS Viewer来查看和检测所发布的地图服务是否满足我们的要求.具体操作如下: 点击开始 -> 所有程 ...
- [转帖]在 Kubernetes 离线部署 KubeSphere
在 Kubernetes 离线部署 KubeSphere https://kubesphere.io/docs/v2.0/zh-CN/installation/install-ks-offline/ ...
- CDH5.16.1集群企业真正离线部署
一.准备工作 1.离线部署主要分为三块: MySQL离线部署 CM离线部署 Parcel文件离线源部署 2.规划 节点 MySQL部署组件 Parcel文件离线源 CM服务进程 大数据组件 hadoo ...
- AutoCAD云产品平台ForgeViewer格式离线部署思路分析
背景 在上一篇博文中CAD图DWG解析WebGIS可视化技术分析总结提到,利用AutoCAD的自有云产品 Autodesk Forge,能在浏览器中渲染 3D 和 2D 模型数据,实现DWG图形的We ...
- 千亿参数开源大模型 BLOOM 背后的技术
假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,"一朝看尽长安花"似乎近在眼前 -- 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM ...
- TiDB在X86和ARM混合平台下的离线部署和升级
[是否原创]是 [首发渠道]TiDB 社区 背景 在之前我们团队发布了TiDB基于X86和ARM混合部署架构的文章:TiDB 5.0 异步事务特性体验--基于X86和ARM混合部署架构,最近有朋友问到 ...
- Cesium简介以及离线部署运行
Cesium简介 cesium是国外一个基于JavaScript编写的使用WebGL的地图引擎,一款开源3DGIS的js库.cesium支持3D,2D,2.5D形式的地图展示,可以自行绘制图形,高亮区 ...
- arcgis api for js入门开发系列一arcgis api离线部署
在我的GIS之家QQ群里,很多都是arcgis api for js开发的新手,他们一般都是GIS专业的学生,或者从计算机专业刚刚转向来的giser,他们难免会遇到各种webgis开发的简单问题,由于 ...
- Node服务一键离线部署
背景说明 项目测试通过,到了上线部署阶段.部署的机器安全限制比较严格,不允许访问外网.此外,没有对外网开放ssh服务,无法通过ssh远程操作. 针对上面提到的两条限制条件,通过下面方式解决: 无法访问 ...
随机推荐
- 【服务器安全问题】双防火墙有什么意义?SSH暴力破解如何防范
发现我的服务器有大量的陌生IP尝试SSH登录,似乎想暴力破解. 我个人习惯是服务器提供商开放了所有端口的,同时也没有开启运维软件提供的防火墙emm 这倒是让我想到了 一般服务器提供商(比如阿里云.华为 ...
- 03-FTP和TFTP命令
http://www.h3c.com/cn/d_202101/1375275_30005_0.htm 1 FTP 1.1 FTP服务器配置命令 1.1.1 display ftp-server 1.1 ...
- SprinfBoot报警告WARNING: An illegal reflective access operation has occurred
警告如图所示,该警告是因为jdk版本太高(我用的是10.0,据说9.0的也会这样),具体的原理还没有研究,它不影响项目的正常运行,但是看着很糟心有木有~~~~ 解决方案是把项目jdk降低到1.8及以下 ...
- Qt项目升级到Qt6经验总结
1 直观总结 增加了很多轮子,同时原有模块拆分的也更细致,估计为了方便拓展个管理. 把一些过度封装的东西移除了(比如同样的功能有多个函数),保证了只有一个函数执行该功能. 把一些Qt5中兼容Qt4的方 ...
- [转]fatal: unable to access ‘https://github.com/nhn/raphael.git/‘: OpenSSL SSL_connect: Connection was
1.问题描述: 在基于webstorm 配置vue环境时,输入npm install 开始自动安装依赖时出现该问题, 2.解决方案: (1)安装配置git环境. (2)更换npm源: npm conf ...
- 网页开发中使用javascript语言时浏览器操作时弹出错误:Uncaught TypeError: Cannot set property 'onClick' of null。
在Chrome浏览器下,遇到了这个错误提示:Uncaught TypeError: Cannot set property 'onClick' of null. 先贴一下JS的代码: document ...
- [转]怎么使用PyCharm编写Python程序,简单教程
原文链接:怎么使用PyCharm编写Python程序,简单教程.
- Bolt.new 30秒做了一个网站,还能自动部署,难道要吊打 Cursor?
大家好,我是汤师爷~ 这篇聊聊 Bolt.new 和 Cursor 的对比. Bolt.new 是一款基于 SaaS 的 AI 编码平台.它由 LLM 驱动的智能体作为底层,并结合 WebContai ...
- ResponseBody与RequestBody-copy
1. ResponseBody @ResponseBody的作用其实是将java对象转为json格式的数据. @responseBody注解的作用是将controller的方法返回的对象通过适当的转换 ...
- runoob-Android 基础入门教程-1
https://www.runoob.com/w3cnote/android-tutorial-interface-design.html 公司的话,大部分使用的都是Axure Rp,但是这个东西比较 ...