纯离线部署本地知识库LLM大模型

一、下载离线大模型

下载的网址:https://hf-mirror.com/

deepseek qwen 相关的模型,只建议使用1.5B的,GGUF后缀的模型
推荐下载llama相关模型,同样是GGUF后缀的,自己笔记本电脑推荐下载8B的

二、下载大模型管理平台 LM Studio

下载网址:https://lmstudio.ai/

安装过程只需要修改一个安装路径,后面一直下一步安装成功。

三、将离线大模型导入到 LM Studio 中

注意:默认情况下,LM Studio 所识别的大模型的目录在C盘

默认路径:C:\Users\用户名\.lmstudio\models

修改大模型的加载目录

  • 先创建一个根目录 ,例如:F:\LMStudioModels
  • 再创建一个二级目录,例如:F:\LMStudioModels\shujia_models 【必须要有一个二级目录】
  • 将模型除.gguf意外的名字拷贝出来,当作一个文件夹的名字
  • 将该模型放在这个文件夹里面

上面操作做完后,LM Studio就可以读取到我们的大模型。

四、通过LM Studio加载我们的大模型【重要,涉及GPU的能力】

  • 点击对话正上方的select a model to load ,选择该对象要使用的大模型
  • 参数解释:
    • Context Length: 该模型一次最大可以加载多少个token

      • 若是简单的问答,推荐4096
      • 若是小红书文案,推荐10000以上
      • 若是写作文,小说,推荐100000左右
    • GPU Offload: 运行时,所占用的GPU显存,建议先给一半
    • CPU Thread Pool Size: 拉满
    • Evaluation Batch Size: 512
    • 后面不动,都以推荐为准

五、调整参数,进行对话

点击右上角实验室器皿图标,show settings,设置Preset,例如添加一个:数学家

理解为:将当前对话的大模型设置成一个固定的角色

设置System Prompt,形容一下这个数学家

六、使用AnythingLLM工具使用LM Studio中的模型,加载知识库

  • 将LM Studio作为一个服务对外提供,让AnythingLLM连接上LM Studio

    • 打开LM Studio点击左边的Developer
    • 打开 Start Server按钮
  • 再AnythingLLM中,点击聊天设置,配置LM Studio,选择,模型

七、提供API服务

  • 在AnythingLLM中左下角点击open settings
  • 点击工具
  • 点击API密钥,生成密钥

纯离线部署本地知识库LLM大模型的更多相关文章

  1. arcgis api 4.x for js 离线部署

    在我的GIS之家群里,经常遇到 webgis 开发新手们提问 arcgis api for js 如何本地离线部署,而不是直接调用在线的,因为在线模式依赖互联网以及网速环境因素,受到的限制影响比较大. ...

  2. ArcGIS for Server内置JS Viewer的离线部署和配置

    很多情况下,在地图服务发布完毕后,我们往往利用 ArcGIS for Server内置的 JS Viewer来查看和检测所发布的地图服务是否满足我们的要求.具体操作如下: 点击开始 -> 所有程 ...

  3. [转帖]在 Kubernetes 离线部署 KubeSphere

    在 Kubernetes 离线部署 KubeSphere https://kubesphere.io/docs/v2.0/zh-CN/installation/install-ks-offline/ ...

  4. CDH5.16.1集群企业真正离线部署

    一.准备工作 1.离线部署主要分为三块: MySQL离线部署 CM离线部署 Parcel文件离线源部署 2.规划 节点 MySQL部署组件 Parcel文件离线源 CM服务进程 大数据组件 hadoo ...

  5. AutoCAD云产品平台ForgeViewer格式离线部署思路分析

    背景 在上一篇博文中CAD图DWG解析WebGIS可视化技术分析总结提到,利用AutoCAD的自有云产品 Autodesk Forge,能在浏览器中渲染 3D 和 2D 模型数据,实现DWG图形的We ...

  6. 千亿参数开源大模型 BLOOM 背后的技术

    假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,"一朝看尽长安花"似乎近在眼前 -- 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM ...

  7. TiDB在X86和ARM混合平台下的离线部署和升级

    [是否原创]是 [首发渠道]TiDB 社区 背景 在之前我们团队发布了TiDB基于X86和ARM混合部署架构的文章:TiDB 5.0 异步事务特性体验--基于X86和ARM混合部署架构,最近有朋友问到 ...

  8. Cesium简介以及离线部署运行

    Cesium简介 cesium是国外一个基于JavaScript编写的使用WebGL的地图引擎,一款开源3DGIS的js库.cesium支持3D,2D,2.5D形式的地图展示,可以自行绘制图形,高亮区 ...

  9. arcgis api for js入门开发系列一arcgis api离线部署

    在我的GIS之家QQ群里,很多都是arcgis api for js开发的新手,他们一般都是GIS专业的学生,或者从计算机专业刚刚转向来的giser,他们难免会遇到各种webgis开发的简单问题,由于 ...

  10. Node服务一键离线部署

    背景说明 项目测试通过,到了上线部署阶段.部署的机器安全限制比较严格,不允许访问外网.此外,没有对外网开放ssh服务,无法通过ssh远程操作. 针对上面提到的两条限制条件,通过下面方式解决: 无法访问 ...

随机推荐

  1. mysql忘记密码的终极解决方案(docker-compose)

    MYSQL8的安全性能有所提高,装好后,各种不适应,需要各种调试. 1. 首先,root密码忘记或是更改,操作步骤: vi mysql/config/my.cnf 在[mysqld]的段中加上一句:s ...

  2. vscode使用github

    1, vscode打开terminal,生成RSA密钥,并查看蜜月 PS D:\code\SQL> git init Reinitialized existing Git repository ...

  3. Flutter 长列表优化

    Flutter 长列表优化 固定列表和长列表的区别 固定列表中的组件,每次都会被重新构建 ListView.builder会按需构建列表元素,也就是只有那些可见得元素才会调用itemBuilder 构 ...

  4. bridge模式下 所有容器的 网关 都是 宿主机docker0网卡的ip

    bridge模式下 所有容器的 网关 都是 宿主机docker0网卡的ip

  5. IDEA自动导包(全局设置)

    选择[File]-->[other settings]-->[settings for new projects](全局设置),然后搜索[Auto Import],勾选以下两个选项即可: ...

  6. Python__FLASK__MySQL基础

    1.数据库的基本操作 创建数据库:使用"CREATE DATABASE 数据库名:"语句创建新的数据库 查看数据库:使用"SHOW DATABASES:"语句查 ...

  7. Springboot整合WebSocket作为服务端遇到的坑

    最近遇到一个需求,对接某公有云上的坐席系统,需要接收人工坐席和客户对话的语音流,然后调用ASR(Automatic Speech Recognition,自动语音识别)引擎,对语音流实时转写,最后将实 ...

  8. v-for和v-if一起使用时的坑:The 'XXX' expression inside 'v-for' directive should be replaced with a computed property that returns filtered array instead. You should not mix 'v-for' with 'v-if'

    目的:Vue - ElementUI中循环渲染表格,控制字段的显示与隐藏 v-if与v-for同时使用. 在Vue中使用v-for循环一个数组/对象时,如果再使用v-if,那么会提示使用计算属性(能正 ...

  9. 即时通讯技术文集(第10期):IM通信协议该选TCP还是UDP [共12篇]

    为了更好地分类阅读52im.net 总计1000多篇精编文章,我将在每周三推送新的一期技术文集,本次是第10 期. [-1-] 简述传输层协议TCP和UDP的区别 [链接] http://www.52 ...

  10. 【TCP协议】---协议详解

    TCP协议 本文内容如下:      1)TCP协议概念      2)TCP头部结构和字段介绍      3)TCP流量控制            滑动窗口      4)TCP拥塞控制      ...