ChatGPT 火了,一大批开源平替也来了
lucidrains/PaLM-rlhf-pytorch
这是一个类似于 ChatGPT 的模型,但使用的是 PaLM 架构。在 PaLM 架构之上实现了 RLHF(人类反馈强化学习)。
注:只有源代码,没有数据,没有模型权重,没有聊天系统。
togethercomputer/OpenChatKit
OpenChatKit 提供了一个强大的开源基础,可以为各种应用程序创建专用和通用聊天机器人。
注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。
oobabooga/text-generation-webui
它是一个用于运行 GPT-J 6B、OPT、GALACTICA、LLaMA 和 Pygmalion 等大型语言模型的 gradio web UI。其目标是成为文本生成领域的 AUTOMATIC1111/stable-diffusion-webui。
注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。
KoboldAI/KoboldAI-Client
这是一个基于浏览器的前端,用于使用多个本地和远程 AI 模型进行 AI 辅助写作。它提供一系列标准工具,包括内存、作者笔记、世界信息、保存和加载、可调整的 AI 设置、格式化选项,以及导入现有 AI Dungeon 冒险的能力。您还可以打开冒险模式并像 AI Dungeon Unleashed 一样玩游戏。
注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。
LAION-AI/Open-Assistant
OpenAssistant 是一个基于聊天的助手,可以理解任务,可以与第三方系统交互,并为此动态检索信息。
注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。
tatsu-lab/stanford_alpaca
这是 Stanford Alpaca 项目的 repo,该项目旨在构建和共享指令遵循的 LLaMA 模型。
注:半开源、非真正开源、基于封闭模型等...
BlinkDL/ChatRWKV
ChatRWKV 类似于 ChatGPT,但由 RWKV(100% RNN)语言模型提供支持,并且是开源的。
注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。
THUDM/ChatGLM-6B
ChatGLM-6B 是一个基于通用语言模型(GLM)框架的开放式双语语言模型,拥有 62 亿个参数。借助量化技术,用户可以在消费级显卡上进行本地部署(INT4 量化级别仅需 6GB GPU 显存)。
注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。
bigscience-workshop/xmtf
此存储库概述了用于创建 BLOOMZ & mT0 和 xP3 的所有组件,这些组件在通过多任务微调进行跨语言泛化一文中介绍。
注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。
carperai/trlx
这是一个用于通过人类反馈(RLHF)进行语言模型分布式训练的代码库,用于微调 GPT 模型以生成聊天文本的工具,支持在线 RL 训练多达 20 亿个参数的模型,以及离线 RL 训练更大的模型。
注:注:只有源代码,没有数据,没有模型权重,没有聊天系统。
databrickslabs/dolly
该模型基于 pythia-12b 进行训练,使用了约 15,000 条指令 / 响应微调记录,这些记录是由 Databricks 员工在 InstructGPT 论文的能力领域中生成的 databricks-dolly-15k。
注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。
LianjiaTech/BELLE
本项目的目标是推动中文大型会话模型开源社区的发展。该项目在原有的 Stanford Alpaca 基础上优化了中文性能。模型微调仅使用通过 ChatGPT 生成的数据(没有其他数据)。此 repo 包含 175 个用于生成数据的中文种子任务、用于生成数据的代码、用于微调模型的 0.5M 生成数据等等。
注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。
ethanyanjiali/minChatGPT
这个示例演示了如何使用 RLHF 技术对齐语言模型,使其能够生成类似于 ChatGPT 的聊天文本。
注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。
cerebras/Cerebras-GPT
7 个开源 GPT-3 样式模型,参数范围从 1.11 亿到 130 亿,使用 Chinchilla 公式 训练。模型权重已在宽松许可下发布(特别是 Apache 2.0 许可)。
注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。
TavernAI/TavernAI
一款主题风格是冒险和探险的聊天机器人,默认 AI 语言模型是 Pygmalion,还包括其他语言模型,比如 KoboldAI、ChatGPT、GPT-4 等。
注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。
Cohee1207/SillyTavern
SillyTavern 是 TavernAI 1.2.8 的一个分支,目前正在积极开发中,并添加了许多主要功能。现在,它们可以被视为完全独立的程序。Tavern 是一个用户界面,它需要与一个 AI 系统后端配合使用,才能发挥作用。有多种支持的后端可供选择,包括 OpenAPI API(GPT)、KoboldAI(可以在本地运行或在 Google Colab 上运行)等。
注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

ChatGPT 火了,一大批开源平替也来了的更多相关文章
- 我用ChatGPT做直播技术选型,卷死了同事
摘要 近两年即时通讯/直播产品炙手可热,市场上针对ToB的产品日益增多,企业该如何去选型呢?本文分享了笔者对于直播产品的思考,将从直播SDK实例功能特性.常见业务场景.注意事项及最佳实践等方面介绍如何 ...
- Python+chatGPT编程5分钟快速上手,强烈推荐!!!
最近一段时间chatGPT火爆出圈!无论是在互联网行业,还是其他各行业都赚足了话题. 俗话说:"外行看笑话,内行看门道",今天从chatGPT个人体验感受以及如何用的角度来分享一下 ...
- Android病毒分析基础(二)—ChatGPT提问技巧
今天我们来用最近比较火的"ChatGPT"学习一下Android病毒分析基础,看看和我们之前学的有什么不同,又能学习到什么新的东西,同时了解一下"ChatGPT" ...
- 思考20230208-关于chatGPT
最近的ChatGPT火了,我今天FQ.充了1 USD买了个虚拟手机号创建了openAI 的账号,试了一把,它的表现令我叹为观止.他已经不再是简单的基于海量数据在网络上搜索已有的答案,而是会根据用户的想 ...
- 从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史(转载)
转载 https://zhuanlan.zhihu.com/p/49271699 首发于深度学习前沿笔记 写文章 从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史 张 ...
- 【开源】OSharp3.3框架解说系列:重新开源及3.3版本新特性
OSharp是什么? OSharp是个快速开发框架,但不是一个大而全的包罗万象的框架,严格的说,OSharp中什么都没有实现.与其他大而全的框架最大的不同点,就是OSharp只做抽象封装,不做实现.依 ...
- 盘点 PHP 和 ASP.NET 的10大对比!
[编者按]本文主要针对开源 PHP 和非开源的 ASP.NET 在性能.成本.可扩展性,技术支持和复杂性等方面进行比较. 在网上论坛,总是有成百上千的文章和帖子在讨论 PHP 和 ASP.NET,究竟 ...
- pyDash:一个基于 web 的 Linux 性能监测工具
pyDash 是一个轻量且基于 web 的 Linux 性能监测工具,它是用 Python 和 Django 加上 Chart.js 来写的.经测试,在下面这些主流 Linux 发行版上可运行:Cen ...
- 剑指Kubernetes 揭秘腾讯云的PaaS技术选型策略
1.前言 Kubernetes 很火,一大批互联网公司早已领先一步,搭建起专有的 PaaS平台,传统企业们看到的 Kubernetes的趋势,亦不甘落后,在试水的道上一路狂奔-- 虽然,Kuberne ...
- 开源ERP-成功案例分析(3)
Odoo用户概要 关于Odoo全球的用户,我们来看一些数据: Odoo目前全球有300万使用者 Odoo系统上每天新创建的数据库超过1000个 Odoo和Word.Excel.PowerPoint一样 ...
随机推荐
- Deltix Round, Summer 2021 Div1 + Div2 A~E
比赛链接:Here 1556A. A Variety of Operations 注意到2, 3操作不改变总和,1操作使得总和加上了一个偶数,故直接判断总和是否为偶数即可.如果和为偶数,只要判断c和d ...
- Codeforces Round #738 (Div. 2) (A~E)
比赛链接:Here 1559A. Mocha and Math 题意: 给定一个区间,选择区间内的值执行 & 操作使得区间最大值最小化 观察样例发现:令 x = (1 << 30) ...
- Web Components从技术解析到生态应用个人心得指北
Web Components浅析 Web Components 是一种使用封装的.可重用的 HTML 标签.样式和行为来创建自定义元素的 Web 技术. Web Components 自己本身不是一个 ...
- linux ntp时间服务器搭建
工作中经验遇到搭建时间服务器的任务,如何搭建网上找的例子总是有些许问题,如下自己动手操作一遍总结一下,方便自己和后来人直接上手使用. 准备工作:192.168.0.1 服务端: ntp服务器192 ...
- mybatis-plus Date类型的参数 只有年月日 没有时分秒的解决办法
问题: 使用mybatis-plus 设计实体的时候 使用 Date inTime; 数据库里的时间2021-11-05 22:00:13 但java里的时间变成了2021-11-05 00: ...
- uniapp解决图形验证码问题及arraybuffer二进制转base64格式图片
https://www.cnblogs.com/huihuihero/p/13183031.html
- uni-app打包到安卓步骤
1.打包到安卓 https://www.bilibili.com/video/BV1BJ411W7pX?p=56 2.打包到IOS https://www.jianshu.com/p/ef6e6e01 ...
- C#爬虫知识介绍
爬虫 爬虫(Web Crawler)是指使用程序自动获取互联网上的信息和数据的一种技术手段.它通常从一个起始网址出发,按照一定的规则递归地遍历网页,并将有用的信息提取出来,然后存储到本地或者数据库中, ...
- java基础-方法method-day05
1. 语法 [修饰符] 返回值类型 方法名(形参列表){ 逻辑主体 } public class TestMethod01{ public static int add(int num1, int n ...
- KVM 核心功能:内存虚拟化
1 内存虚拟化简介 QEMU-KVM 提供内存的虚拟化,从虚拟机角度看其自身拥有的内存就是真实的物理内存.实际上,虚拟机是 host 上的一个 qemu 进程,在为虚拟机指定内存时,host 上并没有 ...