你训练大语言模型(LLM)用的什么框架?有没有想过不用框架训练 GPT-2?

GitHub 上就有这么一位大神(Andrej Karpathy),他仅用大约 1k 行的 C 代码就完成了 GPT-2 模型的训练,代码纯手撸、不依赖任何机器学习框架,作者这么做仅仅是觉得很有趣。尽管这个项目(llm.c)的教学意义大于实用价值,但开源一周便收获了 15k Star,可见大家对他技术的认可和惊叹。

目光回到本周其他的开源热搜项目,在线的数据库设计工具 DrawDB 和程序员专属的在线工具集合 it-tools,它们方便快捷、点开就能用。Spring 框架也想要赶上 AI 潮流,推出了帮助开发 AI 应用的 Spring 框架 spring-ai,旨在简化开发 AI 应用的复杂度。开源的托管网站平台 Coolify,让你通过点点就能部署在线服务。看来不管是硬核的手撸框架,还是提供便利的工具,在 GitHub 上都是很受欢迎的。

  • 本文目录

    • 1. 开源新闻

      • 1.1 Andrej Karpathy 的开源项目
    • 2. 开源热搜项目
      • 2.1 在线的数据库设计工具:DrawDB
      • 2.2 帮助开发 AI 应用的 Spring 框架:spring-ai
      • 2.3 轻松托管网站和服务的开源平台:Coolify
      • 2.4 程序员的在线工具集合:it-tools
      • 2.5 构建你的第二大脑:Quivr
    • 3. HelloGitHub 热评
      • 3.1 面向所有开发者的学习路线图:developer-roadmap
      • 3.2 假装很忙的摸鱼神器:genact
    • 4. 结尾

1. 开源新闻

1.1 Andrej Karpathy 的开源项目

上面说的 llm.c 项目作者 Andrej Karpathy,他博士就读于斯坦福大学,曾就职于特斯拉的自动驾驶部门负责人、OpenAI 的创始成员。

Andrej Karpathy 热衷于深度神经网络和开源,在 GitHub 上有 71k 的粉丝。他的另外一个开源项目 nanoGPT,也是 GitHub 热榜(Trending)的常客。

nanoGPT 是用于训练/微调中等规模 GPT 模型的库。它是对 minGPT 的重写,这次的重点是速度和效率而不是教育性,值得一提的是 minGPT 的作者也是 Andrej Karpathy。

GitHub 地址:https://github.com/karpathy/nanoGPT

2. 开源热搜项目

2.1 在线的数据库设计工具:DrawDB

主语言:JavaScriptStar:4.7k周增长:3.8k

这个开源项目是一个免费、简单、强大的数据库实体关系(DBER)在线编辑器,无需注册即可直接在浏览器中使用。它提供了直观、可视化的操作界面,用户通过点击即可构建数据库表和导出建表语句,还可以导入建表语句,实现可视化编辑、错误检查等。支持 MySQL、PostgreSQL、SQLite、MariaDB、SQL Server 共 5 种常用的关系数据库。

GitHub 地址→https://github.com/drawdb-io/drawdb

2.2 帮助开发 AI 应用的 Spring 框架:spring-ai

主语言:JavaStar:1.7k周增长:300

这是由 Spring 官方开源的用于简化包含 AI 功能的应用开发的 Java 框架,它可以轻松接入 OpenAI、Microsoft、Amazon、Google 和 Huggingface 等主流模型供应商,以及聊天、文本生成图像的模型类型,支持提示工程、AI 模型转 POJO 对象、矢量数据库、RAG(检索增强生成)等有助于开发 AI 应用的功能。

GitHub 地址→https://github.com/spring-projects/spring-ai

2.3 轻松托管网站和服务的开源平台:Coolify

主语言:PHPStar:13k周增长:800

这是一个免费、自托管、可替代 Heroku / Netlify / Vercel 等平台的开源项目,它提供了一个 Web 平台,用户可以在上面管理、部署各种 Web 应用和数据库服务,比如多种编程语言的动态网站、静态网页、WordPress、MongoDB、Redis 等。不挑服务器可以是自己的服务器,也可以是任意云服务器,只要支持 SSH 连接即可,服务器最低配置仅需 2C2G 即可。

GitHub 地址→https://github.com/coollabsio/coolify

2.4 程序员的在线工具集合:it-tools

主语言:VueStar:9.9k周增长:500

该项目采用 Vue.js(Vue 3)和 Naive UI 组件库开发,汇集了对开发人员和 IT 从业者有用的工具。它免费、界面清爽、功能丰富,支持包括中文在内的多国语言,提供了加密、转化器、网络、文本等开发常用工具。

GitHub 地址→https://github.com/CorentinTh/it-tools

2.5 构建你的第二大脑:Quivr

主语言:TypeScript、PythonStar:31k周增长:300

该项目利用生成式 AI 的能力,成为你的第二大脑。你可以将多种格式的文本、数据、语言和视频上传给它,之后再和它对话时,它会学习你上传的内容后回答你的问题,支持接入多种 LLM 和 Docker 一键部署。

GitHub 地址→https://github.com/QuivrHQ/quivr

3. HelloGitHub 热评

在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。

3.1 面向所有开发者的学习路线图:developer-roadmap

主语言:Other

这是一份包含后端、前端、运维部署等方向的学习路径图,提供了全面、实用、交互式的学习指南,解决开发者面临技术选型困难、自学路径不明晰等痛点。

项目详情→https://hellogithub.com/repository/50587cd6e95e4fb0b3c787104028e9d2

3.2 假装很忙的摸鱼神器:genact

主语言:Rust

该项目可以在终端上模拟一些很忙的假象,比如编译、扫描、下载等。这些操作都是假的,实际上什么都没有发生,所以不会影响你的电脑,适用于 Windows、Linux、macOS 操作系统。

项目详情→https://hellogithub.com/repository/6a78a0168ffc4a9f931b0ac1983aea9f

4. 结尾

无论是崇拜大神们的技术造诣,还是探索开源世界中的新奇工具,都希望大家可以从中获得启发和收获。如果看完这些还不过瘾,可以通过阅读往期回顾的内容,找到更多热门开源项目。

往期回顾

以上为本周的「GitHub 热点速递」全部内容,如果你发现其他好玩、有趣的 GitHub 项目,就来 HelloGitHub 和大家一起分享吧。

一周涨 15k Star 的开源项目「GitHub 热点速览」的更多相关文章

  1. 朋友圈那串神秘字符背后的开源项目「GitHub 热点速览」

    ​如果你这周没刷到类似 "npub1sg6plzptd64u62a878hep2kev88swjh3tw00gjsfl8f237..." 的一串字符,那就说明本期 GitHub T ...

  2. 开源不到 48 小时获 35k star 的推荐算法「GitHub 热点速览」

    本周的热点除了 GPT 各类衍生品之外,还多了一个被马斯克预告过.在愚人节开源出来的推特推荐算法,开源不到 2 天就有了 35k+ 的 star,有意思的是,除了推荐算法本身之外,阅读源码的工程师们甚 ...

  3. Python 霸榜的一周,又有什么新 AI 力作呢?「GitHub 热点速览」

    GPT 带火了一波语言模型,LLaMA 和 Alpaca 也在持续发力.依旧是各类 GPT 后缀霸榜 GitHub trending 的一周,为此特推部分专门收录了两个比较不错的 GPT 应用.而作为 ...

  4. 平平无奇的项目「GitHub 热点速览 v.22.10」

    不知道大家对高星项目什么印象?提到这个词第一个想到哪个项目呢?本周有几个项目看着普普通通,却完成了一周 2k+ star 的事迹.比如 SingleFile,它是个浏览器扩展,点击图标之后即可保存一个 ...

  5. NB 的开源项目遍地开花——GitHub 热点速览 Vol.41

    作者:HelloGitHub-小鱼干 本周的 GitHub 热点速览的关键词便是 nb,也是本周特推之一的项目名字,这个功能如名字一般 nb 的项目是一个脚本,帮你处理笔记.书签.归档和知识库应用程序 ...

  6. 揭开周获 18k star 开源项目的神秘面纱「GitHub 热点速览 v.22.28」

    本周 GitHub Trending 的项目重量十足,比如标题的一周获得 18k+ 的高性能 JS Runtime--bun,用性能来体现了它的"含金量".同样有重量的还有一行代码 ...

  7. 万星开源项目强势回归「GitHub 热点速览 v.22.38」

    本周霸榜的 GitHub 项目多为老项目,比如:老面孔的 theatre 凭借极其优秀的动画功底连续三天霸榜 TypeScript 类目.借 Figma 被 Adobe 收购之风,又出现在 GitHu ...

  8. 大型项目源码集合「GitHub 热点速览 v.21.39」

    作者:HelloGitHub-小鱼干 代码,尤其是优雅规范的代码,一直都是学习编程技巧的捷径.虽然有实用的代码小片段,能拯救当前业务的燃眉之急,但是真要去提升自己的技能还是得从大型的项目,尤其是有一定 ...

  9. GitHub 开源的小工具「GitHub 热点速览 v.21.45」

    作者:HelloGitHub-小鱼干 Copilot 是 GitHub 官方出品的代码自动补全工具,之前使用该工具需要有一定的要求.而本周靠 2k+ star 上热点的 copilot-docs 则是 ...

  10. GitHub 开源了多款字体「GitHub 热点速览 v.22.48」

    本期 News 快读有 GitHub 官方大动作一下子开源了两款字体,同样大动作的还有 OpenAI 发布的对话模型 ChatGPT,引燃了一波人机对话. 项目这块,也许会成为新的 Web 开发生产力 ...

随机推荐

  1. 适用于AbpBoilerplate的RocketChat Api库

    RocketChat 适用于AbpBoilerplate的RocketChat Api库 Rocket.Chat 是一个免费.开源.可扩展.高度可定制且安全的平台,可让您与团队进行交流和协作.共享文件 ...

  2. Linux 常见缩写命令英文全称

    linux 命令参考Linux 命令大全: https://man.linuxde.net/ awk = "Aho Weiberger and Kernighan" 三个作者的姓的 ...

  3. Android MaterialButtonToggleGroup使用

    原文地址: Android MaterialButtonToggleGroup使用 - Stars-One的杂货小窝 觉得单选框不好看,发现了一个Material里的单选按钮组,感觉UI还不错,记下使 ...

  4. 写了个简单爬虫,分析 Boss 直聘自动驾驶岗位

    两年前,朋友想知道 Boss 直聘上关于自动驾驶的岗位有哪些 ,于是,笔者写了一个简单的爬虫 crawler-boss ,将岗位的信息收集起来. 这篇文章,笔者想分享爬虫 crawler-boss 的 ...

  5. [深度学习] 计算机视觉低代码工具Supervision库使用指北

    Supervision库是一款出色的Python计算机视觉低代码工具,其设计初衷在于为用户提供一个便捷且高效的接口,用以处理数据集以及直观地展示检测结果.Supervision库的官方开源仓库地址为: ...

  6. SQLI-LABS(Less-11、12)

    Less-11(POST-Error Based-Single Quotes-String) 打开Less-11的页面,可以看到一个登录框,需要输入用户名和密码,由本关名字可知SQL语句是单引号闭合. ...

  7. Rust使用Sauron实现Web界面交互

    目录 简介 架构 Application 和组件 简单入门示例 先决条件 创建新项目 编译库文件 引用库文件 运行项目 界面交互示例 创建项目 编译库文件 引用库文件 引用库文件 运行项目 参考资料 ...

  8. js实现页面窗口录制

    一.在线demo 1.在线demo地址:http://www.lb0125.com/videoRecord.html 注:目前测试发现只有在chrome浏览器里可以使用 二.直接上代码 <!DO ...

  9. Linux服务器下启动和关闭node

    首先将node工程的代码和node_modules目录上传到服务器的某一个目录下 1.用forever 进行管理 前提:linux下已经安装了node npm install -g forever / ...

  10. 使用maven命令 创建基于Scala的flink项目

    windows下 mvn archetype:generate ^ -DarchetypeGroupId=org.apache.flink ^ -DarchetypeArtifactId=flink- ...