搬迁说明

之前在 CSDN 上发文章，一直想着努力发一些好的文章出来！这篇文章在 2024-04-17 10:11:55 已在 CSDN 发布

写在前面

其他显卡环境也可以！但是最少要有8GB的显存，不然很容易爆。

如果有多显卡的话，单机多卡也是很好的方案！！！

背景介绍

目前借到一台算法组的服务器，我们可以查看一下目前显卡的情况

nvidia-smi

PS: (后续已经对CUDA等进行了升级，可看我的其他文章，有升级的详细过程)

项目地址

官方的地址：

# 需要克隆项目

https://github.com/THUDM/ChatGLM2-6B

# 模型下载（如果你没有科学，麻烦一点需要手动下载）

https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/?p=%2Fchatglm2-6b-int4&mode=list

# 模型下载（如果可以科学，官方下载的体验是比较舒适的）

https://huggingface.co/THUDM/chatglm2-6b-int4

我们需要对项目进行克隆，同时需要下载对应的模型，如果你有科学，可以忽略模型的下载，因为你启动项目的时候它会自己下载。

配置要求

根据官方的介绍，可以看到对应的显卡要求，根据我的情况(2070Super 8GB * 2)，我这里选择下载了INT4的模型。

安装Pyenv

由于很多不同的项目队python版本的要求不同，同时对版本的要求也不同，所以你需要配置一个独立的环境。

这里你可以选择 Conda，也可以选择pyenv，或者docker。我选的方案是：pyenv

# pyenv 官方地址

https://github.com/pyenv/pyenv

安装完成之后，记得配置一下环境变量：

echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bashrc

echo 'command -v pyenv >/dev/null || export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bashrc

echo 'eval "$(pyenv init -)"' >> ~/.bashrc

如果你和我一样使用的是 ZSH 的话：

echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.zshrc

echo '[[ -d $PYENV_ROOT/bin ]] && export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.zshrc

echo 'eval "$(pyenv init -)"' >> ~/.zshrc

测试Pyenv

# 查看当前系统中的Python情况

pyenv versions

使用Pyenv

# Python版本

pyenv local 3.10

# 独立环境

python -m venv env

# 切换环境

source env/bin/active

# cd 到项目目录

# 安装Python库 pip install - requirements.txt

你将看到类似的内容，我这里在 MacBook 上测试的：

安装依赖

# Python版本

pyenv local 3.10

# 独立环境

python -m venv env

# 切换环境

source env/bin/active

# cd 到项目目录

# 安装Python库 pip install - requirements.txt

注意: 这是两个部分：(这是我服务器的配置，你也要搞清楚你的内容放置在哪里) 如下图：

项目文件夹 /home/jp/wzk/chatglm2-6b-int4/ChatGLM2-6B
模型文件夹 /home/jp/wzk/chatglm2-6b-int4/chatglm2-6b-int4

项目文件夹：

模型文件夹

启动项目

在项目的目录下，我们利用现成的直接启动：web_demo.py

# 先打开看一眼

vim web_demo.py

model_path 是你下载的模型文件夹（如果你不是手动下载的话，可以不改，这样的话会自动下载）

PS: 此时需要到最后一行，修改对外暴露服务

# 代码修改为这样

demo.queue().launch(server_name="0.0.0.0", server_port=7861, share=False, inbrowser=True)

退出保存，我们启动服务：

python web_demo.py

使用项目

完成上述的操作，稍等后看到：

根据你的服务器IP和端口，访问即可:

多卡启动

由于单卡很容易爆 OOM，正好这里是 2 * 2070Super 8GB，我们简单的修改一下代码，就可以将模型分到两张显卡中。

官方给的方案是，通过accelerate库来启动。

修改刚才的 web_demo.py，详细位置请看图：

# GPU 数量修改为2

model = load_model_on_gpus(model_path, num_gpus=2)

重新启动即可，就已经是多卡启动了！！！

LLM-01 大模型本地部署运行 ChatGLM2-6B-INT4(6GB) 简单上手环境配置单机单卡多卡 2070Super8GBx2 打怪升级！的更多相关文章

Form_Form Builder本地部署运行的实现（案例）
2014-08-09 Created By BaoXinjian
Dubble 01 架构模型&start project
Dubbo 01 架构模型传统架构 All in One 测试麻烦,微小修改全都得重新测单体架构也称之为单体系统或者是单体应用.就是一种把系统中所有的功能.模块耦合在一个应用中的架构方式.其优点 ...
三分钟快速上手TensorFlow 2.0 （下）——模型的部署、大规模训练、加速
前文:三分钟快速上手TensorFlow 2.0 (中)——常用模块和模型的部署 TensorFlow 模型导出使用 SavedModel 完整导出模型不仅包含参数的权值,还包含计算的流程(即计算 ...
可在广域网部署运行的QQ高仿版 -- GG叽叽V3.4，增加系统设置、最近联系人、群功能（源码）
自从上次版本(GG叽叽V3.2,增加离线消息.离线文件功能)发布后,我个人觉得主要的大功能都实现得差不多了,接下来的几个版本将不断优化GG的细节,提高其可用性.这次版本更新的内容主要是为GG增加了系统 ...
IntelliJ IDEA打包WAR并部署运行(mac osx)将Web项目War包部署到Tomcat服务器基本步骤（完整版）
用IntelliJ IDEA做web开发体验很好,但导出war包比eclipse麻烦了不少,以下是解决方案: 打包:1.自动打包:File —> Project Structure —> ...
arcgis api for javascript本地部署加载地图
最近开始学习arcgis api for javascript,发现一头雾水,决定记录下自己的学习过程. 一.下载arcgis api for js 4.2的library和jdk,具体安装包可以去官 ...
windows下百度离线人脸识别本地部署与使用（nodejs做客户端，c++做服务端，socket做通信）
1.离线人脸识别本地部署详情请阅读百度人脸识别官网 2.nodejs做socket通信的客户端为什么不直接通过调用c++编译的exe获得人脸识别结果? 原因:exe运行时会加载很多模型而消耗很多时 ...
Kubernetes 学习笔记（二）：本地部署一个 kubernetes 集群
前言前面用到过的 minikube 只是一个单节点的 k8s 集群,这对于学习而言是不够的.我们需要有一个多节点集群,才能用到各种调度/监控功能.而且单节点只能是一个加引号的"集群&quo ...
三分钟快速上手TensorFlow 2.0 （中）——常用模块和模型的部署
本文学习笔记参照来源:https://tf.wiki/zh/basic/basic.html 前文:三分钟快速上手TensorFlow 2.0 (上)——前置基础.模型建立与可视化 tf.train. ...
二手车价格预测 | 构建AI模型并部署Web应用 ⛵
作者:韩信子@ShowMeAI 数据分析实战系列:https://www.showmeai.tech/tutorials/40 机器学习实战系列:https://www.showmeai.tech/t ...

随机推荐

【C#】操作word 【Aspose.Words】
上图是要填充的word模板,就是一个接口说明文档.那个像书名号括起来的东西就是要替换的,这个东西并不是键盘输入的书名号,它是文档部件的一种,要插入这个东西需要: 打开模板word文件,用office打 ...
JS / jQuery 刷新页面的方法
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
Android 12(S) MultiMedia Learning（二）MediaPlayer Java
Android提供了MediaPlayer这样一个简单易用的音视频java播放接口,通过几个接口调用即可实现音视频播放. 源码位置 http://aospxref.com/android-12.0.0 ...
使用 Hugging Face 推理终端搭建强大的“语音识别 + 说话人分割 + 投机解码”工作流
Whisper 是当前最先进的开源语音识别模型之一,毫无疑问,也是应用最广泛的模型.如果你想部署 Whisper 模型,Hugging Face 推理终端能够让你开箱即用地轻松部署任何 Whispe ...
数据库系列16：MyISAM与InnoDB的索引对比
相关文章数据库系列:MySQL慢查询分析和性能优化数据库系列:MySQL索引优化总结(综合版) 数据库系列:高并发下的数据字段变更数据库系列:覆盖索引和规避回表数据库系列:数据库高可用及无损扩 ...
LeetCode 207. Course Schedule 课程表 (C++/Java)
题目: There are a total of n courses you have to take, labeled from 0 to n-1. Some courses may have pr ...
铭瑄B760 ITX 无法睿频无法跑满
铭瑄B760 ITX 无法睿频无法跑满状况: 铭瑄B760 ITX + 12600K,跑分时,大核最高 3.7GHz,电压也不到1V.CPU-Z 跑分才600. 解决方法: 1.关机. 2.长按 ...
将手机声音通过蓝牙输入到WIN10电脑-安卓手机投屏直播无声音
安卓手机投屏无声音,斗鱼,虎牙,直播无声音.可以用本方案,前提是电脑要有蓝牙功能,没有蓝牙,可以购买一个USB蓝牙适配器(不建义买CSR芯片的,CSR驱动会导致office 和远程桌面有问题). 操作 ...
vits-simple-api搭建
根据vits-simple-api中文文档指南自行搭建后端以下步骤均在windows平台cpu推理搭建为例选择你的vits模型(注意是vits!不是So-Vits Bert Vits2 Gpt V ...
小白也能玩转Git：从入门到实战详细教程
Git介绍 Git是一种分布式版本控制系统,它广泛应用于软件开发中.通过Git,开发人员可以追踪文件的变化.协作工作.管理代码库等.与集中式版本控制系统(如SVN)不同,Git使每个开发人员都具有完整 ...

LLM-01 大模型 本地部署运行 ChatGLM2-6B-INT4(6GB) 简单上手 环境配置 单机单卡多卡 2070Super8GBx2 打怪升级！