开源大模型占GPU显存计算方法

运行大模型GPU占用计算公式：

\(M=\frac{(P * 4B)}{32 / Q} * 1/2\)

M : 以GB标识的GPU内存
P : 模型中的参数数量，例如一个7B模型有70亿参数
4B : 4个字节，表示用于每个参数的字节
32 : 4个字节中有32位
Q : 应该用于加载模型的位数，例如16位、8位、4位
1.2 : 表示在GPU内存中加载其他内容的20%开销

常用大模型内存占用

大小（billion）	模型位数	显存占用（GB）
1.5B	4	0.9
1.5B	8	1.8
1.5B	16	3.6
7B	4	4.2
7B	8	8.4
7B	16	16.8
9B	4	5.4
9B	8	10.8
9B	16	21.6
40B	4	24
40B	8	48
40B	16	96
70B	4	42
70B	8	84
70B	16	168

量化大模型的标准写法

经常看到量化大模型后面带着q2_k 、ft16 、 q5_k_s 、q8_0 等写法。这类写法代表着大模型的量化后的指标，释义如下：

传统量化

包括q4_0、q4_1、q8_0等方法。

如q4_0。代表模型位数=4，0表示保留0位小数。即数据会被量化到0-255之间的整数

K值量化

如q2_k、q5_k_s 等方法。实际上就是不同层用不同精度量化，以比传统量化更智能的方式分配bit。解压缩方式与传统量化类似,同样快速

开源大模型占GPU显存计算方法的更多相关文章

千亿参数开源大模型 BLOOM 背后的技术
假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,"一朝看尽长安花"似乎近在眼前 -- 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM ...
（原）tensorflow中使用指定的GPU及GPU显存
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/6591923.html 参考网址: http://stackoverflow.com/questions ...
GPU 显存释放
我们在使用tensorflow 的时候, 有时候会在控制台终止掉正在运行的程序,但是有时候程序已经结束了,nvidia-smi也看到没有程序了,但是GPU的内存并没有释放,那么怎么解决该问题呢? 首先 ...
tensorflow中使用指定的GPU及GPU显存
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 本文目录 1 终端执行程序时设置使用的GPU 2 python代码中设置使用的GPU 3 设置tensorflow使用的显 ...
解决GPU显存未释放问题
前言今早我想用多块GPU测试模型,于是就用了PyTorch里的torch.nn.parallel.DistributedDataParallel来支持用多块GPU的同时使用(下面简称其为Dist). ...
解决矩池云GPU显存未释放问题
很多用户反馈说终止程序之后,显存依然被占用,这里我们提供了两种解决方案,帮助用户解决这个问题. nvidia-smi查看我们可以先用如下命令 nvidia-smi 查看一下当前GPU进程情况. _ ...
ubuntu服务器常见使用技巧及-kill掉后GPU显存不释放进程-
如何解决python进程被kill掉后GPU显存不释放的问题 1 重新开一个shell,然后输入: ps aux|grep user_name|grep python.所有该用户下的python程序就 ...
Ubuntu-Tensorflow 程序结束掉GPU显存没有释放的问题
笔者在ubuntu上跑Tensorflow的程序的时候,中途使用了Win+C键结束了程序的进行,但是GPU的显存却显示没有释放,一直处于被占用状态. 使用命令 nvidia-smi 显示如下两个GP ...
gpu显存（全局内存）在使用时数据对齐的问题
全局存储器,即普通的显存,整个网格中的随意线程都能读写全局存储器的任何位置. 存取延时为400-600 clock cycles 很easy成为性能瓶颈. 訪问显存时,读取和存储必须对齐,宽度为4B ...
查找和杀掉占用GPU显存的进程
用只有2个G的显卡跑数据就需要在训练之前先把无关进程杀掉,防止跑到一半显存满了 nvidia-smi:显示当前GPU中的线程 kill -9 PID:输入PID以结束线程

随机推荐

VUE商城项目 - 项目优化上线 - 手稿
TLScanary：Pwn中的利器
TLScanary:Pwn中的利器引言:什么是TLScanary? 在二进制漏洞利用(Pwn)领域,攻击者面临着层层防护措施的挑战.在安全竞赛(如CTF)和实际漏洞利用中,TLS(线程本地存储) ...
题解：P10722 [GESP202406 六级] 二叉树
题意一颗 \(n\) 节点的二叉树,每个节点非黑即白,给你 \(Q\) 次操作,每次给你一个 \(u\),把 \(u\) 的子树内所有节点颜色反转,问最终每个节点的颜色. 分析看到数据范围,首先把 ...
[rCore学习笔记 014]批处理系统
写在前面本随笔是非常菜的菜鸡写的.如有问题请及时提出. 可以联系:1160712160@qq.com GitHhub:https://github.com/WindDevil (目前啥也没有本章目 ...
ASP.NET Core 程序集注入（二）
public void ConfigureServices(IServiceCollection services) { string strValue = Configuration.GetSect ...
PointNet笔记
可能遇到的问题在windows上运行pointnet的代码时,可能会遇到一些问题: 1.比如提示OSError: no file with expected extension, 这是因为可视化的s ...
关于RuntimeException与事务
1.spring的默认回滚策略当采用@Transactional注解方法抛出RuntimeException时,spring会默认回滚事务对于检查型异常(即不是RuntimeException子类 ...
PyCharm配置Miniconda3
打开PyCharm,点击"File"(文件)菜单,选择"Settings"(设置) 选择python interpreter中的配置选择add 选择Conda ...
idea2020修改help的vm options之后导致idea打不开的问题
如图所示,如果你修改了VM参数,导致启动没反应,证明你的参数配置有误. 这个时候你可能会想着直接修改idea安装目录bin中的配置文件,但是这个文件并不是你在idea中修改的配置文件,所以你修改这里的 ...
【Keepalived】KP + NGINX 多机热备学习
案例搭建环境是三台机器,两台也可以最后一个IP是测试的VIP 192.168.124.21 centos6-1 192.168.124.22 centos6-2 192.168.124.23 ce ...