运行模型对比 gemma:7b, llama2, mistral, qwen:7b

【gemma:2b】

total duration: 1m5.2381509s
load duration: 530.9µs
prompt eval duration: 110.304ms
prompt eval rate: 0.00 tokens/s
eval count: 604 token(s)
eval duration: 1m5.126287s
eval rate: 9.27 tokens/s

【gemma:7b】
total duration: 3m47.1115598s
load duration: 9.8098239s
prompt eval count: 110 token(s)
prompt eval duration: 12.228888s
prompt eval rate: 9.00 tokens/s
eval count: 573 token(s)
eval duration: 3m25.072638s
eval rate: 2.79 tokens/s

【llama2】
total duration: 4m34.6780371s
load duration: 4.9036352s
prompt eval count: 137 token(s)
prompt eval duration: 11.521429s
prompt eval rate: 11.89 tokens/s
eval count: 963 token(s)
eval duration: 4m18.252497s
eval rate: 3.73 tokens/s

【mistral】
total duration: 2m58.0946434s
load duration: 4.4304491s
prompt eval count: 129 token(s)
prompt eval duration: 11.605211s
prompt eval rate: 11.12 tokens/s
eval count: 626 token(s)
eval duration: 2m42.059441s
eval rate: 3.86 tokens/s

【qwen:7b】
total duration: 1m0.2411658s
load duration: 1.04ms
prompt eval duration: 276.492ms
prompt eval rate: 0.00 tokens/s
eval count: 220 token(s)
eval duration: 59.96335s
eval rate: 3.67 tokens/s

gemma:7b vs llama2

总结来说，llama2运行在加载速度和prompt评估速率上有明显提升，但是由于处理的令牌总数增加导致整体评估阶段耗时增加，使得整个过程的总耗时延长。不过，在大规模处理任务中，提高单位时间内处理令牌的数量（prompt eval rate 和 eval rate）通常被视为性能改善的一个重要指标。

vs mistral
综合来看，这次运行的整体效率和单位时间内处理令牌的能力都有所提升，尤其是在总时长和整个评估阶段的处理速度上有显著改善。然而，处理的令牌总数较上次减少，可能反映了任务规模的变化或其他程序内部逻辑的调整。

vs qwen7b
综合分析，这次运行在加载速度和处理速度上表现优秀，特别是在处理少量令牌时的效率显著提高。然而，由于缺少prompt部分的具体令牌处理情况，对于prompt部分的性能评估无法给出明确结论。总体来看，如果目标是在短时间内高效处理较少数量的令牌，这次运行的表现是更好的。

AI 新世代

Online ChatAi

Link：https://www.cnblogs.com/farwish/p/18051582

运行模型对比 gemma:7b, llama2, mistral, qwen:7b的更多相关文章

Linux与Windows的设备驱动模型对比
Linux与Windows的设备驱动模型对比名词缩写: API 应用程序接口(Application Program Interface ) ABI 应用系统二进制接口(Application Bi ...
OSI七层模型和tcp/ip四层模型对比
OSI 与TCP/IP 模型对比 OSI 协议层名称 TCP/IP 协议层名称封装的单元功能描述 TCP/IP协议应用层(Application) 应用层(Application) 数据应用程 ...
select、poll、epoll模型对比
select.poll.epoll模型对比先说Select: 1.Socket数量限制:该模式可操作的Socket数由FD_SETSIZE决定,内核默认32*32=1024. ...
Cortex-A7 MPCore 简介与处理器运行模型
Cortex-A7 MPcore 处理器支持 1~4 核,通常是和 Cortex-A15 组成 big.LITTLE 架构的,Cortex-A15 作为大核负责高性能运算,比如玩游戏啥的,Cortex ...
运行模型，COM错误，解决问题步骤
运行模型,COM错误,解决问题步骤 1.数据新建一个,路径短一点,不要有中文 2.所有数据重新导入 3.文档新建 4,问题莫名奇妙解决了
[书籍翻译] 《JavaScript并发编程》第二章 JavaScript运行模型
本文是我翻译<JavaScript Concurrency>书籍的第二章 JavaScript运行模型,该书主要以Promises.Generator.Web workers等技术来讲解J ...
C#开发BIMFACE系列30 服务端API之模型对比1：发起模型对比
系列目录 [已更新最新开发文章,点击查看详细] 在实际项目中,由于需求变更经常需要对模型文件进行修改.为了便于用户了解模型在修改前后发生的变化,BIMFACE提供了模型在线对比功能,可以利用在 ...
C#开发BIMFACE系列31 服务端API之模型对比2：获取模型对比状态
系列目录 [已更新最新开发文章,点击查看详细] 在上一篇<C#开发BIMFACE系列30 服务端API之模型对比1:发起模型对比>中发起了2个模型对比,由于模型对比是在BIMFAC ...
C#开发BIMFACE系列32 服务端API之模型对比3：批量获取模型对比状态
系列目录 [已更新最新开发文章,点击查看详细] 在<C#开发BIMFACE系列31 服务端API之模型对比2:获取模型对比状态>中介绍了根据对比ID,获取一笔记录的对比状态.由于模 ...
C#开发BIMFACE系列33 服务端API之模型对比4：获取模型对比结果
系列目录 [已更新最新开发文章,点击查看详细] 模型对比可以对两个文件/模型进行差异性分析,确定两个文件/模型之间构件的几何和属性差异,包括增加的构件.删除的构件和修改的构件. 模型对应可以用 ...

随机推荐

django(路由层）
一.简介 # 路由匹配 url(r'test',views.test), url(r'test_add',views.test_add) # r'test'与请求头的数据进行正则匹配 ''' url方 ...
FreeRTOS教程7 事件组
1.准备材料正点原子stm32f407探索者开发板V2.4 STM32CubeMX软件(Version 6.10.0) Keil µVision5 IDE(MDK-Arm) 野火DAP仿真器 XCO ...
三维模型3DTile格式轻量化顶点压缩主要技术方法分析
三维模型3DTile格式轻量化顶点压缩主要技术方法分析三维模型顶点压缩是3DTile格式轻量化压缩的重要组成部分,能有效减小数据大小,提高数据处理效率.下面将详细分析几种主要的顶点压缩技术方法: 预 ...
记录--vue中封装一个右键菜单组件（复制粘贴即可使用）
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助组件介绍关于web端的右键功能常用的地方有表格的右键,或者tab标签的右键等,本文记录一下封装一个右键菜单组件的思路步骤代码. 程序员除 ...
TP6框架--CRMEB学习笔记：布置后台管理框架+配置路由
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助最近在研究一个基于TP6的框架CRMEB,这里分享下我的开发心得首先在上篇文章中,我们安装了CRMEBphp接口项目,需要可以看这一篇 ...
css实现按钮点击水波纹效果和两边扩散效果
废话少说,先上代码了,复制到html中即可使用点击查看代码 <!DOCTYPE html> <html lang="en"> <head> & ...
Bad magic number for central directory
Bad magic number for central directory 运行代码输出如下bug: File "/home/a/Prediction/Predict_Models.py& ...
elasticsearch 增删查改
#分词验证 POST _analyze { "analyzer":"ik_max_word", "text":"elasticse ...
vue3中的样式为什么加上scoped不生效
<style>标签添加scoped属性时,Vue会自动为该组件内的所有元素添加一个独特的数据属性,例如data-v-f3f3eg9.同时,它也会修改你的CSS选择器,使得它们只匹配带有这个 ...
Bootstrap实战 - 单页面网站
一.介绍单页面结构简单.布局清晰,常常用来做手机 App 或者某个产品的下载介绍页面.现在,展示型网页整体趋向于单页网站设计,这样一次性把核心信息展现出来,对于用户来说更加直观和简单,能够快速了解一 ...

运行模型对比 gemma:7b, llama2, mistral, qwen:7b

运行模型对比 gemma:7b, llama2, mistral, qwen:7b的更多相关文章

随机推荐

热门专题