你训练大语言模型(LLM)用的什么框架?有没有想过不用框架训练 GPT-2?

GitHub 上就有这么一位大神(Andrej Karpathy),他仅用大约 1k 行的 C 代码就完成了 GPT-2 模型的训练,代码纯手撸、不依赖任何机器学习框架,作者这么做仅仅是觉得很有趣。尽管这个项目(llm.c)的教学意义大于实用价值,但开源一周便收获了 15k Star,可见大家对他技术的认可和惊叹。

目光回到本周其他的开源热搜项目,在线的数据库设计工具 DrawDB 和程序员专属的在线工具集合 it-tools,它们方便快捷、点开就能用。Spring 框架也想要赶上 AI 潮流,推出了帮助开发 AI 应用的 Spring 框架 spring-ai,旨在简化开发 AI 应用的复杂度。开源的托管网站平台 Coolify,让你通过点点就能部署在线服务。看来不管是硬核的手撸框架,还是提供便利的工具,在 GitHub 上都是很受欢迎的。

  • 本文目录

    • 1. 开源新闻

      • 1.1 Andrej Karpathy 的开源项目
    • 2. 开源热搜项目
      • 2.1 在线的数据库设计工具:DrawDB
      • 2.2 帮助开发 AI 应用的 Spring 框架:spring-ai
      • 2.3 轻松托管网站和服务的开源平台:Coolify
      • 2.4 程序员的在线工具集合:it-tools
      • 2.5 构建你的第二大脑:Quivr
    • 3. HelloGitHub 热评
      • 3.1 面向所有开发者的学习路线图:developer-roadmap
      • 3.2 假装很忙的摸鱼神器:genact
    • 4. 结尾

1. 开源新闻

1.1 Andrej Karpathy 的开源项目

上面说的 llm.c 项目作者 Andrej Karpathy,他博士就读于斯坦福大学,曾就职于特斯拉的自动驾驶部门负责人、OpenAI 的创始成员。

Andrej Karpathy 热衷于深度神经网络和开源,在 GitHub 上有 71k 的粉丝。他的另外一个开源项目 nanoGPT,也是 GitHub 热榜(Trending)的常客。

nanoGPT 是用于训练/微调中等规模 GPT 模型的库。它是对 minGPT 的重写,这次的重点是速度和效率而不是教育性,值得一提的是 minGPT 的作者也是 Andrej Karpathy。

GitHub 地址:https://github.com/karpathy/nanoGPT

2. 开源热搜项目

2.1 在线的数据库设计工具:DrawDB

主语言:JavaScriptStar:4.7k周增长:3.8k

这个开源项目是一个免费、简单、强大的数据库实体关系(DBER)在线编辑器,无需注册即可直接在浏览器中使用。它提供了直观、可视化的操作界面,用户通过点击即可构建数据库表和导出建表语句,还可以导入建表语句,实现可视化编辑、错误检查等。支持 MySQL、PostgreSQL、SQLite、MariaDB、SQL Server 共 5 种常用的关系数据库。

GitHub 地址→https://github.com/drawdb-io/drawdb

2.2 帮助开发 AI 应用的 Spring 框架:spring-ai

主语言:JavaStar:1.7k周增长:300

这是由 Spring 官方开源的用于简化包含 AI 功能的应用开发的 Java 框架,它可以轻松接入 OpenAI、Microsoft、Amazon、Google 和 Huggingface 等主流模型供应商,以及聊天、文本生成图像的模型类型,支持提示工程、AI 模型转 POJO 对象、矢量数据库、RAG(检索增强生成)等有助于开发 AI 应用的功能。

GitHub 地址→https://github.com/spring-projects/spring-ai

2.3 轻松托管网站和服务的开源平台:Coolify

主语言:PHPStar:13k周增长:800

这是一个免费、自托管、可替代 Heroku / Netlify / Vercel 等平台的开源项目,它提供了一个 Web 平台,用户可以在上面管理、部署各种 Web 应用和数据库服务,比如多种编程语言的动态网站、静态网页、WordPress、MongoDB、Redis 等。不挑服务器可以是自己的服务器,也可以是任意云服务器,只要支持 SSH 连接即可,服务器最低配置仅需 2C2G 即可。

GitHub 地址→https://github.com/coollabsio/coolify

2.4 程序员的在线工具集合:it-tools

主语言:VueStar:9.9k周增长:500

该项目采用 Vue.js(Vue 3)和 Naive UI 组件库开发,汇集了对开发人员和 IT 从业者有用的工具。它免费、界面清爽、功能丰富,支持包括中文在内的多国语言,提供了加密、转化器、网络、文本等开发常用工具。

GitHub 地址→https://github.com/CorentinTh/it-tools

2.5 构建你的第二大脑:Quivr

主语言:TypeScript、PythonStar:31k周增长:300

该项目利用生成式 AI 的能力,成为你的第二大脑。你可以将多种格式的文本、数据、语言和视频上传给它,之后再和它对话时,它会学习你上传的内容后回答你的问题,支持接入多种 LLM 和 Docker 一键部署。

GitHub 地址→https://github.com/QuivrHQ/quivr

3. HelloGitHub 热评

在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。

3.1 面向所有开发者的学习路线图:developer-roadmap

主语言:Other

这是一份包含后端、前端、运维部署等方向的学习路径图,提供了全面、实用、交互式的学习指南,解决开发者面临技术选型困难、自学路径不明晰等痛点。

项目详情→https://hellogithub.com/repository/50587cd6e95e4fb0b3c787104028e9d2

3.2 假装很忙的摸鱼神器:genact

主语言:Rust

该项目可以在终端上模拟一些很忙的假象,比如编译、扫描、下载等。这些操作都是假的,实际上什么都没有发生,所以不会影响你的电脑,适用于 Windows、Linux、macOS 操作系统。

项目详情→https://hellogithub.com/repository/6a78a0168ffc4a9f931b0ac1983aea9f

4. 结尾

无论是崇拜大神们的技术造诣,还是探索开源世界中的新奇工具,都希望大家可以从中获得启发和收获。如果看完这些还不过瘾,可以通过阅读往期回顾的内容,找到更多热门开源项目。

往期回顾

以上为本周的「GitHub 热点速递」全部内容,如果你发现其他好玩、有趣的 GitHub 项目,就来 HelloGitHub 和大家一起分享吧。

一周涨 15k Star 的开源项目「GitHub 热点速览」的更多相关文章

  1. 朋友圈那串神秘字符背后的开源项目「GitHub 热点速览」

    ​如果你这周没刷到类似 "npub1sg6plzptd64u62a878hep2kev88swjh3tw00gjsfl8f237..." 的一串字符,那就说明本期 GitHub T ...

  2. 开源不到 48 小时获 35k star 的推荐算法「GitHub 热点速览」

    本周的热点除了 GPT 各类衍生品之外,还多了一个被马斯克预告过.在愚人节开源出来的推特推荐算法,开源不到 2 天就有了 35k+ 的 star,有意思的是,除了推荐算法本身之外,阅读源码的工程师们甚 ...

  3. Python 霸榜的一周,又有什么新 AI 力作呢?「GitHub 热点速览」

    GPT 带火了一波语言模型,LLaMA 和 Alpaca 也在持续发力.依旧是各类 GPT 后缀霸榜 GitHub trending 的一周,为此特推部分专门收录了两个比较不错的 GPT 应用.而作为 ...

  4. 平平无奇的项目「GitHub 热点速览 v.22.10」

    不知道大家对高星项目什么印象?提到这个词第一个想到哪个项目呢?本周有几个项目看着普普通通,却完成了一周 2k+ star 的事迹.比如 SingleFile,它是个浏览器扩展,点击图标之后即可保存一个 ...

  5. NB 的开源项目遍地开花——GitHub 热点速览 Vol.41

    作者:HelloGitHub-小鱼干 本周的 GitHub 热点速览的关键词便是 nb,也是本周特推之一的项目名字,这个功能如名字一般 nb 的项目是一个脚本,帮你处理笔记.书签.归档和知识库应用程序 ...

  6. 揭开周获 18k star 开源项目的神秘面纱「GitHub 热点速览 v.22.28」

    本周 GitHub Trending 的项目重量十足,比如标题的一周获得 18k+ 的高性能 JS Runtime--bun,用性能来体现了它的"含金量".同样有重量的还有一行代码 ...

  7. 万星开源项目强势回归「GitHub 热点速览 v.22.38」

    本周霸榜的 GitHub 项目多为老项目,比如:老面孔的 theatre 凭借极其优秀的动画功底连续三天霸榜 TypeScript 类目.借 Figma 被 Adobe 收购之风,又出现在 GitHu ...

  8. 大型项目源码集合「GitHub 热点速览 v.21.39」

    作者:HelloGitHub-小鱼干 代码,尤其是优雅规范的代码,一直都是学习编程技巧的捷径.虽然有实用的代码小片段,能拯救当前业务的燃眉之急,但是真要去提升自己的技能还是得从大型的项目,尤其是有一定 ...

  9. GitHub 开源的小工具「GitHub 热点速览 v.21.45」

    作者:HelloGitHub-小鱼干 Copilot 是 GitHub 官方出品的代码自动补全工具,之前使用该工具需要有一定的要求.而本周靠 2k+ star 上热点的 copilot-docs 则是 ...

  10. GitHub 开源了多款字体「GitHub 热点速览 v.22.48」

    本期 News 快读有 GitHub 官方大动作一下子开源了两款字体,同样大动作的还有 OpenAI 发布的对话模型 ChatGPT,引燃了一波人机对话. 项目这块,也许会成为新的 Web 开发生产力 ...

随机推荐

  1. CefSharp 开发触屏终端遇到的问题记录

    一.背景 最开始准备使用的 Chromely 做一个终端机项目,本来以为挺顺利的一个事情折腾了两天半.由于无法直接控制窗体的属性,最后还是切换到 .NET Framework 4.8 + CefSha ...

  2. Asp .Net Web Forms 系列:配置图片防盗链的几种方法

    通过 URL Rewrite Module 组件 URL Rewrite Module 是一个用于在 ASP.NET Web Forms 或其他基于 IIS 的 Web 应用程序中重写 URL 的强大 ...

  3. C# NAudio 播放多个MP3文件

    C# 使用 NAudio 来播放多个MP3文件.上代码 1.引入NAudio:using NAudio.Wave; 2.定义变量: private WaveOutEvent outputDevice; ...

  4. 24_用Qt和FFmpeg实现简单的YUV播放器

    前面文章FFmpeg像素格式转换中我们使用FFmpeg实现了一个像素格式转换工具类,现在我们就可以在Qt中利用QImage很容易的实现一个简单的YUV播放器了. 播放器功能很简单,只有播放.暂停和停止 ...

  5. 21_显示YUV图片&视频

    一.显示YUV图片 显示 YUV 图片和显示 BMP 图片的大致流程是一样的.显示 BMP 图片我们可以直接获取到 BMP 图片的 surface,然后直接从 surface 创建纹理.显示 YUV ...

  6. STM32 启动代码分析

    PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 前置说明   本文作为本人csdn blog的主站的备份.(Bl ...

  7. 在winform中如何实现双向数据绑定?

    什么是双向数据绑定? 双向数据绑定是一种允许我们创建持久连接的技术,使模型数据和用户界面(UI)之间的交互能够自动同步.这意味着当模型数据发生变化时,UI会自动更新,反之亦然.这种双向数据绑定极大地简 ...

  8. Newtonsoft.Json/Json.NET忽略序列化时的意外错误

    在.NET中Newtonsoft.Json(Json.NET)是我们常用来进行Json序列化与反序列化的库. 而在使用中常会遇到反序列化Json时,遇到不规则的Json数据解构而抛出异常. Newto ...

  9. 记录--用js如何实现将手机号中间的几位数字变成****

    这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 今天,我们要实现一个很常见并且简单的功能:将手机号中间的几位数变成**** 这个功能其实很常见,比如我们微信的账号安全里面显示的手机号.掘 ...

  10. ps去除图片中间部分并拼合

    今天分享一个用ps去除图片中间部分后,把剩下的部分拼合的技术. 需求 下面这张图,需要去掉第三列(顺丰包邮价) ps处理过程 1.导入图片到ps软件 快捷键方式:Ctrl + O: 手动打开方式:点击 ...