2023年7月18日Meta开源了Llama2,在2万亿个Token上训练,可用于商业和研究,包括从7B到70B模型权重、预训练和微调的代码。相比Llama1,Llama2有较多提升,评估结果如下所示:

基于Llama2模型的开源模型如下所示:

1.WizardCoder Python V1.0

https://huggingface.co/WizardLM/WizardCoder-Python-13B-V1.0
https://huggingface.co/WizardLM/WizardCoder-Python-34B-V1.0

2.Phind Code Llama v1

https://huggingface.co/Phind/Phind-CodeLlama-34B-v1
https://huggingface.co/Phind/Phind-CodeLlama-34B-Python-v1

3.WizardLM 70B V1.0

https://huggingface.co/WizardLM/WizardLM-70B-V1.0

4.Dophin Llama 2 7B

https://huggingface.co/ehartford/dolphin-llama2-7b

5.Airoboros L2 2.0

https://huggingface.co/jondurbin/airoboros-l2-7b-gpt4-2.0
https://huggingface.co/jondurbin/airoboros-l2-13b-gpt4-2.0
https://huggingface.co/jondurbin/airoboros-33b-gpt4-2.0
https://huggingface.co/jondurbin/airoboros-l2-70b-gpt4-2.0

6.OpenOrca Preview2 13B

https://huggingface.co/Open-Orca/OpenOrcaxOpenChat-Preview2-13B

7.Vicuna v1.5 16k

https://huggingface.co/lmsys/vicuna-7b-v1.5-16k
https://huggingface.co/lmsys/vicuna-13b-v1.5-16k

8.Vicuna v1.5

https://huggingface.co/lmsys/vicuna-7b-v1.5
https://huggingface.co/lmsys/vicuna-13b-v1.5

9.Hermes LLongMA-2 8k

https://huggingface.co/conceptofmind/Hermes-LLongMA-2-7b-8k
https://huggingface.co/conceptofmind/Hermes-LLongMA-2-13b-8k

10.OpenChat V3.2

https://huggingface.co/openchat/openchat_v3.2

11.Llama 2 70B Instruct v2

https://huggingface.co/upstage/Llama-2-70b-instruct-v2

12.StableBeluga

https://huggingface.co/stabilityai/StableBeluga-7B
https://huggingface.co/stabilityai/StableBeluga-13B
https://huggingface.co/stabilityai/StableBeluga2

13.Holodeck

https://huggingface.co/KoboldAI/LLAMA2-13B-Holodeck-1
https://huggingface.co/KoboldAI/LLAMA2-13B-Holodeck-1-GGML

14.Llama 2 7B 32K

https://huggingface.co/togethercomputer/LLaMA-2-7B-32K

15.Kimiko

https://huggingface.co/nRuaif/Kimiko_7B
https://huggingface.co/nRuaif/Kimiko_13B

v16.LLongMA 2 16k**

https://huggingface.co/conceptofmind/LLongMA-2-7b-16k
https://huggingface.co/conceptofmind/LLongMA-2-13b-16k

17.Airoboros L2 GPT4 1.4.1

https://huggingface.co/jondurbin/airoboros-l2-7b-gpt4-1.4.1
https://huggingface.co/jondurbin/airoboros-l2-13b-gpt4-1.4.1
https://huggingface.co/jondurbin/airoboros-l2-70b-gpt4-1.4.1

**18.Llama 2 13B Orca 8kv

https://huggingface.co/OpenAssistant/llama2-13b-orca-8k-3319

19.WizardLM 13B V1.2

https://huggingface.co/WizardLM/WizardLM-13B-V1.2

20.LLongMA 2 8k

https://huggingface.co/conceptofmind/LLongMA-2-7b
https://huggingface.co/conceptofmind/LLongMA-2-13b

21.Nous Hermes Llama 2

https://huggingface.co/NousResearch/Nous-Hermes-llama-2-7b
https://huggingface.co/NousResearch/Nous-Hermes-llama-2-7b-GGML
https://huggingface.co/NousResearch/Nous-Hermes-Llama2-13b
https://huggingface.co/NousResearch/Nous-Hermes-Llama2-13b-GGML
https://huggingface.co/NousResearch/Nous-Hermes-Llama2-13b-GPTQ

22.Redmond Puffin 13B

https://huggingface.co/NousResearch/Redmond-Puffin-13B
https://huggingface.co/NousResearch/Redmond-Puffin-13B-GGML

23.Llama 2 7B Uncensored

https://huggingface.co/georgesung/llama2_7b_chat_uncensored

24.Luna AI 7B Chat Uncensored

https://huggingface.co/Tap-M/Luna-AI-Llama2-Uncensored

25.Guanaco Llama 2

https://huggingface.co/Mikael110/llama-2-7b-guanaco-fp16
https://huggingface.co/Mikael110/llama-2-13b-guanaco-fp16
https://huggingface.co/Mikael110/llama-2-70b-guanaco-qlora

26.Chinese Llama 2 7B

https://github.com/LinkSoul-AI/Chinese-Llama-2-7b

27.llama2-Chinese-chat

https://github.com/CrazyBoyM/llama2-Chinese-chat

参考文献:

[1]https://github.com/facebookresearch/llama

[2]https://github.com/facebookresearch/llama-recipes/

[3]https://ai.meta.com/resources/models-and-libraries/llama-downloads/

[4]https://github.com/facebookresearch/llama/blob/main/MODEL_CARD.md

[5]https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

[6]https://ai.meta.com/resources/models-and-libraries/llama/

[7]https://github.com/ovh/ai-training-examples/blob/main/notebooks/natural-language-processing/llm/miniconda/llama2-fine-tuning/llama_2_finetuning.ipynb

[8]https://blog.ovhcloud.com/fine-tuning-llama-2-models-using-a-single-gpu-qlora-and-ai-notebooks/

[9]https://www.reddit.com/r/LocalLLaMA/wiki/models/

[10]大模型评测:https://opencompass.org.cn/

基于Llama2模型的开源模型的更多相关文章

  1. 基于PaddlePaddle的语义匹配模型DAM,让聊天机器人实现完美回复 |

    来源商业新知网,原标题:让聊天机器人完美回复 | 基于PaddlePaddle的语义匹配模型DAM 语义匹配 语义匹配是NLP的一项重要应用.无论是问答系统.对话系统还是智能客服,都可以认为是问题和回 ...

  2. 全球首个开放应用模型 OAM 开源 | 云原生生态周报 Vol. 23

    作者 | 临石.元毅.冬岛.衷源.天元 业界要闻 全球首个开放应用模型 OAM 开源 2019 年 10 月 17 日,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟(花名:小邪)在 Qcon ...

  3. 全球首个开放应用模型 OAM 开源

    业界要闻 全球首个开放应用模型 OAM 开源 2019 年 10 月 17 日,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟(花名:小邪)在 Qcon 上海重磅宣布,阿里云与微软联合推出开放应 ...

  4. 从开源模型、框架到自研,声网 Web 端虚拟背景算法正式发布

    根据研究发现,在平均 38 分钟的视频会议里面,大概会有 13 分钟左右的时间用于处理和干扰相关的事情.同时研究也表明在参加在线会议的时候,人们更加倾向于语音会议,其中一个关键原因就是大家不希望个人隐 ...

  5. 基于git的源代码管理模型——git flow

    基于git的源代码管理模型--git flow A successful Git branching model

  6. 详解Linux2.6内核中基于platform机制的驱动模型 (经典)

    [摘要]本文以Linux 2.6.25 内核为例,分析了基于platform总线的驱动模型.首先介绍了Platform总线的基本概念,接着介绍了platform device和platform dri ...

  7. 【神经网络篇】--基于数据集cifa10的经典模型实例

    一.前述 本文分享一篇基于数据集cifa10的经典模型架构和代码. 二.代码 import tensorflow as tf import numpy as np import math import ...

  8. 基于MATLAB搭建的DDS模型

    基于MATLAB搭建的DDS模型 说明: 累加器输出ufix_16_6数据,通过cast切除小数部分,在累加的过程中,带小数进行运算最后对结果进行处理,这样提高了计算精度. 关于ROM的使用: 直接设 ...

  9. 基于R语言的ARIMA模型

    A IMA模型是一种著名的时间序列预测方法,主要是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型.ARIMA模型根据原序列是否平稳以及 ...

  10. 第13章 TCP编程(4)_基于自定义协议的多线程模型

    7. 基于自定义协议的多线程模型 (1)服务端编程 ①主线程负责调用accept与客户端连接 ②当接受客户端连接后,创建子线程来服务客户端,以处理多客户端的并发访问. ③服务端接到的客户端信息后,回显 ...

随机推荐

  1. mac应用已损坏无法打开

    sudo xattr -r -d com.apple.quarantine /User/name/yourapp # '/User/name/yourapp' 替换成你自己要安装的 mac 应用地址 ...

  2. 10. 用Rust手把手编写一个wmproxy(代理,内网穿透等), HTTP内网穿透支持修改头信息

    用Rust手把手编写一个wmproxy(代理,内网穿透等), HTTP内网穿透支持修改头信息 项目 ++wmproxy++ gite: https://gitee.com/tickbh/wmproxy ...

  3. gitlab ci 用 cypress/playwright 做测试并展示结果至 mr

    前言 看了一下官方的教程好像都没有讲怎么将测试结果展示出来,只是给出测试的 ci 脚本,但根据 gitlab 官方的文档是有测试报告的展示的,所以这里给出一个基于 junit 测试报告的展示. 前期准 ...

  4. oracle RAC redhat

    RAC比较严格,如果操作系统不纯净,容易失败: 装备第一台VM:chkconfig sendmail offchkconfig iptables offchkconfig ip6talbes offs ...

  5. math库常用函数+产生随机数总结

    math库常用函数+产生随机数总结 1.对x开平方 double sqrt(x)://返回值为double类型,输入的x类型随意,只要是数的类型 2.求常数e的x次方 double exp(x);// ...

  6. 基于matomo实现业务数据埋点采集上报

    matomo是一款Google-analytics数据埋点采集上报的平替方案,可保护您的数据和客户的隐私:正如它官网的slogan: Google Analytics alternative that ...

  7. [ABC216G] 01Sequence 题解

    01Sequence 题目大意 构造一个满足 \(m\) 个形如 \((l,r,x)\) 的限制条件的 \(01\) 序列,其中 \((l,r,x)\) 表示区间 \([l,r]\) 的和不小于 \( ...

  8. 一款简单漂亮的WPF UI - AduSkin

    前言 经常会有同学会问,有没有好看简单的WPF UI库推荐的.今天就给大家推荐一款简单漂亮的WPF UI,融合多个开源框架组件:AduSkin. WPF是什么? WPF 是一个强大的桌面应用程序框架, ...

  9. JavaScript(ES6):变量的解构赋值

    解构赋值定义: 允许按照一定模式从数组或对象中提取值,然后对变量进行赋值. 数组的解构赋值 注:数组的元素要一次排序的,变量的值由他的位置决定. 基本用法 // ES6 解构赋值 let [a, b, ...

  10. 题解 SP15454

    前言 数学符号约定 \(\operatorname{lowbit}(x)\):表示 \(x\) 的二进制最低位. \([a,b]\):表示区间 \(a\sim b\),其中包含 \(a,\,b\) 端 ...