聊聊ChatGLM-6B部署与微调的深入理解

又见阿郎 2026-01-01 22:36:55 原文

ChatGLM的部署，主要是两个步骤：

在Github上下载chatglm的库文件
在Hugging Face上下载模型参数与配置文件

ChatGLM包

从Github上看ChatGLM项目文件的结构来看，仅仅是包含三种部署方式的py代码与微调的py代码

而相关的实现细节，比如神经网络、激活函数、损失函数等具体的实现，并不在该项目源码中。

不管以哪种方式部署，最核心就是三句代码，其作用是引入模型参数，初始化transformers配置；以web部署的方式为例：

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)

model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()

model = model.eval()

// 引入Gradio，实现web方式的使用

// 调用模型方法，开始进行对话推理

xx = model.stream_chat(xxxx);

web的调用是基于Gradio；

api的调用是基于fastapi；

cli的调用是基于python解释器；

微调

微调的解决方案一般是P-Tuning或LoRA；ChatGLM-6B是基于P-Tuning v2实现的微调，P-Tuning v2是基于连续提示(continuous prompts)的思想。微调会生成新的模型参数文件，也称为checkpoint文件。

微调时可以选择全参数微调或是部分参数微调，其流程是训练+推理。训练生成新的checkpoint文件(模型参数)；推理则是加载模型参数文件。

训练前，需要调整参数，一般修改train.sh脚本文件就行。

推理时，加载原模型文件与微调后生成的checkpoint文件。还是通过那三句代码。

输出的checkpoint文件如下：

checkpoint文件夹内的文件如下：

transformers的联系

目前的模型，都会对接到Hugging Face平台的transformers库中，通过transformers库来管控大模型。所以在推理阶段通过三句代码就能调用AI模型。在微调阶段，生成的checkpoint文件中，其结构是Hugging Face平台的文件结构，包含transformers的相关配置及初始化信息。

总结

聊聊ChatGLM-6B部署与微调的深入理解的更多相关文章

Tomcat 部署 Web 项目的本质理解
手动创建Web项目不借助集成开发工具IDE,直接手动创建一个Web项目,有助于理解Web项目的本质. 1.首先建立一个myweb文件夹(自己定义项目名). 2.然后可以建一个html文件(文件里面只 ...
IDEA 部署Tomcat教程（透彻理解操作）
目录首先我们看一下 IDEA 里的当前项目结构配置设置 Web 资源目录和 Tomcat读取的 web.xml 配置文件 Tomcat 的 Run/Debug 配置处理常见问题 Web资源找不到 ...
《进击吧！Blazor！》系列入门教程第一章 8.部署
<进击吧!Blazor!>是本人与张善友老师合作的Blazor零基础入门教程视频,此教程能让一个从未接触过Blazor的程序员掌握开发Blazor应用的能力. 视频地址:https://s ...
使用Kylin构建企业大数据分析平台的4种部署方式
本篇博客重点介绍如何使用Kylin来构建大数据分析平台.根据官网介绍,其实部署Kylin非常简单,称为非侵入式安装,也就是不需要去修改已有的 Hadoop大数据平台.你只需要根据的环境下载适合的Kyl ...
Office web app server2013详细的安装和部署
转自:http://blog.csdn.net/u011355311/article/details/9360293 SharePoint 2013集成Office web apps server20 ...
Windows Phone 8初学者开发—第8部分：理解编译和部署
原文 Windows Phone 8初学者开发—第8部分:理解编译和部署第8部分:理解编译和部署原文地址: http://channel9.msdn.com/Series/Windows-Phon ...
eclipse maven项目中使用tomcat插件部署项目
maven的tomcat插件部署web项目,我简单认为分两种,一种是部署到内置tomcat,另一种是部署到安装的tomcat. 第一种部署,默认是部署在内置tomcat的8080端口,如果不需要改端口 ...
[svc]rsync简单部署
安装rsync服务端-backup服务器 yum install rsync -y useradd rsync -s /sbin/nologin -M chown -R rsync.rsync /da ...
在github Pages上部署octopress搭建个人博客系统
原文链接:http://caiqinghua.github.io/blog/2013/08/26/deploy-octopress-to-github-pages/ 引子上一篇博客已经说了为什么要搭 ...
Azure资源模板化部署，伦家不懒都不好意思了
如果老板让你在云平台上部署一套系统,你准备怎么做? 嗯,估计得根据具体需求开通或创建一大堆东西:虚拟机.存储.数据库.虚拟网络……别急还没完,接着还要对这些东西的规模.配置等各方面调整和优化.一系列环 ...

随机推荐

Mac上使用Royal TSX快速连接到OCI主机
问题: 每次使用Royal TSX连接到OCI主机都要交互式输入opc这个用户名,次数多了也蛮烦. 那如何既指定用户名,又想要通过ssh私钥登陆机器呢? 这个需求确实很初级,但也着实困扰过我,因为开始 ...
起风了，NCC 云原生项目孵化计划
时间回到 2016 年,彼时 .NET Core 1.0 刚刚发布 1.0 版本,我跟几位好友共同发起 .NET Core 中文学习组(.NET Core China Studying Group)和 ...
[ARC143B] Counting Grids 题解
Counting Grids 题目大意将 \(1\sim n^2\) 填入 \(n\times n\) 的网格 \(A\) 中,对于每个格子满足以下条件之一: 该列中存在大于它的数. 该行中存在小于 ...
C# 在流行度指数上将超过Java
2023年10月最新的TIOBE编程语言流行指数表明:C#和Java之间的差距从未如此之小,目前,差异仅为1.2%,如果趋势保持这种状态,C#将在大约2个月内超过Java,TIOBE Software ...
.Net Core 3.1 服务端配置跨域
一.在Startup.cs 的 ConfigureServices 配置好跨域策略原文链接:https://www.jianshu.com/p/534b9a6a6ed5 public void Co ...
this.$router 与this.$route的区别
this.$router是Vue-Router的实例,需要导航到不同路由则用this.$router.push方法 this.$route为当前路由的跳转对象,包含当前路由的name.path.que ...
musl中strlen源码实现和分析
最近在学习<C 和指针>的第 6 章指针部分,在 6.12 章节看到了 strlen 函数的实现,联想到最近有在看 musl 的源码,于是就把 musl 中 strlen 的源码认真地分析 ...
2020年第十一届蓝桥杯第二场C/C++ B组省赛题解
2020年第十一届蓝桥杯C/C++ B组省赛题解试题A:门牌制作 [问题描述] 小蓝要为一条街的住户制作门牌号. 这条街一共有 \(2020\) 位住户,门牌号从 \(1\) 到 \(2020\) ...
大白话说Python+Flask入门（三）
写在前面今天状态很不好,我发现学这部分知识的时候,会出现溜号或者注意力无法集中的情况. 我能想到的是,大概率是这部分知识,应该是超出了我现在的水平了,也就是说我存在知识断层了,整体感觉真的是一知半解 ...
LeetCode-Java：88合并两个有序数组
题目: 给你两个按非递减顺序排列的整数数组 nums1 和 nums2,另有两个整数 m 和 n ,分别表示 nums1 和 nums2 中的元素数目. 请你合并 nums2 到 nums1 中 ...