近日,Meta(原 Facebook)开源了他们公司的新一代大模型 Llama 3,虽然目前只放出了 8B 和 70B 两个版本,但是在评估结果上已经优于 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等大模型。Meta 官方还表示,这些只是开胃菜,更强的 400B 参数的模型已经在训练中了,预计几个月后将和大家见面(开源与否尚不明确)。

说回上周的热门开源项目,最近基于 LLM 构建知识库的开源项目很火,但我一个都没收录。因为如果是本地起大模型效果不好,请求大模型的 API 又不免费,所以我找到了一个 OpenAI API 反向代理开源项目,可用来实现免费白嫖 OpenAI API。内容也是知识库的关键,Reader 能够将网页内容转化成 LLM 友好的文本。对于没有编程基础的小伙伴,这有一个 30-Days-Of-Python 的开源教程,学它!当然,学习之余也可以娱乐一下,比如试试‘无名杀’,这是一款类似于三国杀的开源卡牌游戏。

  • 本文目录

    • 1. 开源新闻

      • 1.1 Meta 开源 Llama 3 大模型
    • 2. 开源热搜项目
      • 2.1 OpenAI API 免费反向代理:ChatGPT
      • 2.2 一门新兴的系统级编程语言:Zig
      • 2.3 将网页内容转化成 LLM 友好的文本:Reader
      • 2.4 三国杀类型的卡牌游戏:noname
      • 2.5 为期 30 天的 Python 编程挑战:30-Days-Of-Python
    • 3. HelloGitHub 热评
      • 3.1 自定义 Windows 任务栏透明度的小工具:TranslucentTB
      • 3.2 跨平台的手写笔记和绘图应用:Rnote
    • 4. 结尾

1. 开源新闻

1.1 Meta 开源 Llama 3 大模型

今年初,扎克伯格就曾公开解释过:​Meta 为什么开源 Llama 模型?

  1. 改进模型:开源可以借助社区的力量持续提升模型的质量,因为社区的反馈和审查有助于安全性和运行效率的提升,而这对每个人都有益。
  2. 产品发展:虽然开源并不排除将模型转化为商业产品的可能性,开源模型的领导者可以将社区创新整合进自家产品中,提高产品竞争力。
  3. 行业标准:开源软件有潜力成为行业标准,从而促进技术发展和统一性。
  4. 吸引人才:由于开发者和研究人员更倾向于参与开源项目,开源策略可以帮助公司吸引和招聘到行业内的优秀人才。

最新发布的 Llama 3 相较于 Llama 2 在参数规模、训练数据集、模型架构(GQA)、性能、多语言支持、推理和代码生成方面都有所提升,但现在对中文支持的不是很好,而且 meta.ai 上用的还是 Llama 2。

GitHub 地址:github.com/meta-llama/llama3

2. 开源热搜项目

2.1 OpenAI API 免费反向代理:ChatGPT

主语言:TypeScriptStar:3.7k周增长:1k

虽然现在无需登陆就可以免费使用 ChatGPT(gpt-3.5-turbo 模型),但如果是想用接口的话还要收费的。该项目就是基于免费的 ChatGPT 网站服务,将其转化成免费的 ChatGPT API,接口返回和官方一致,支持 Docker 部署。需要注意的是部署的服务器,要在 OpenAI 服务支持的国家和地区。

GitHub 地址→github.com/PawanOsman/ChatGPT

2.2 一门新兴的系统级编程语言:Zig

主语言:ZigStar:30k周增长:300

这是一种命令式、通用、静态类型、编译的系统编程语言,注重性能、安全和可读性。它支持编译时泛型与反射、交叉编译以及手动存储器管理,目标为改进 C 语言,可以轻松地和 C 语言的代码库配合工作。Zig 简洁且直接,没有隐式控制流、没有隐式内存分配、没有预处理器、没有宏,特别适合用于开发编译器、操作系统内核、桌面应用、性能敏感的应用、嵌入式系统等。

const std = @import("std");
const parseInt = std.fmt.parseInt; test "parse integers" {
const input = "123 67 89,99";
const ally = std.testing.allocator; var list = std.ArrayList(u32).init(ally);
// Ensure the list is freed at scope exit.
// Try commenting out this line!
defer list.deinit(); var it = std.mem.tokenizeAny(u8, input, " ,");
while (it.next()) |num| {
const n = try parseInt(u32, num, 10);
try list.append(n);
} const expected = [_]u32{ 123, 67, 89, 99 }; for (expected, list.items) |exp, actual| {
try std.testing.expectEqual(exp, actual);
}
}

GitHub 地址→github.com/ziglang/zig

2.3 将网页内容转化成 LLM 友好的文本:Reader

主语言:TypeScriptStar:3k周增长:2.5k

该项目可以将指定的 URL 内容转化为干净、LLM 友好的文本,从而提高 Agent 和 RAG 系统的输入质量,可作为构建知识库的一环。我试用了一下,内容提取效果不错,但是对于需要登陆才能访问的 URL 就不行了。

GitHub 地址→github.com/jina-ai/reader

2.4 三国杀类型的卡牌游戏:noname

主语言:JavaScriptStar:1.9k周增长:100

「无名杀」是一款以三国为背景的卡牌策略游戏,它完全免费、无广告,玩法和三国杀一样,但自由度高很多,有海量武将可供玩家选择,还支持自制武将和技能,提供了身份、国战、斗地主、塔防、单挑、联机等游戏模式。

GitHub 地址→github.com/libccy/noname

2.5 为期 30 天的 Python 编程挑战:30-Days-Of-Python

主语言:PythonStar:31k周增长:600

该项目是帮助人们在 30 天内学会 Python 编程语言,通过每天的练习和学习,逐渐掌握 Python 的基础和进阶知识,全部完成可能需要超过 100 天。该教程适合想要快速入门 Python 的初学者,或者对 Python 有一定了解,想通过实践深入理解 Python 的开发者。

GitHub 地址→github.com/Asabeneh/30-Days-Of-Python

3. HelloGitHub 热评

在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。

3.1 自定义 Windows 任务栏透明度的小工具:TranslucentTB

主语言:C++

该项目是采用 C++ 开发的用于调整 Windows 任务栏透明度的工具,它体积小、免费、简单易用,支持 5 种任务栏状态、6 种动态模式、Windows 10/11 操作系统。

项目详情→hellogithub.com/repository/48c9ce6373cd4e108d74bcb4f8ac7a41

3.2 跨平台的手写笔记和绘图应用:Rnote

主语言:Rust

这是一款用 Rust 和 GTK4 编写的绘图应用,可用于绘制草图、手写笔记和注释文档等。它支持导入/导出 PDF 和图片文件,以及无限画布、拖放、自动保存等功能。适用于 Windows、Linux 和 macOS 系统,需要搭配手写板使用。

项目详情→hellogithub.com/repository/1d768cfa742c4fcd9c0a0bd4374cb425

4. 结尾

在结束本周「GitHub 热点速递」的精彩内容后,希望这些开源项目能够对大家有所启发,帮助你们找到新的工具、学习资源或是娱乐项目。如果看完这些还不过瘾,可以通过阅读「往期回顾」的内容,找到更多热门开源项目。

往期回顾

以上为本周的「GitHub 热点速递」全部内容,如果你发现其他好玩、有趣的 GitHub 项目,就来 HelloGitHub 和大家一起分享吧。

Llama 3 开源了「GitHub 热点速览」的更多相关文章

  1. 朋友圈那串神秘字符背后的开源项目「GitHub 热点速览」

    ​如果你这周没刷到类似 "npub1sg6plzptd64u62a878hep2kev88swjh3tw00gjsfl8f237..." 的一串字符,那就说明本期 GitHub T ...

  2. 如何让程序更健壮「GitHub 热点速览」

    对于 ML 模型训练而言,好的数据集能让结果更健壮,cleanlab 是一个降低数据噪音,及时帮你修正数据集错误的工具.好的工具能让你的结果更完美.同样的,RedTeam-Tools 提高了渗透测试的 ...

  3. 真·生产力「GitHub 热点速览」

    这些工具真的能极大提高生产力,节约你的时间来自(摸)我(鱼)增(划)值(水).先别提 style2paints,你给它随意画个草图,就能给你一个能交付给甲方爸爸的成品插画.如果提升 30%-40% 传 ...

  4. 开源不到 48 小时获 35k star 的推荐算法「GitHub 热点速览」

    本周的热点除了 GPT 各类衍生品之外,还多了一个被马斯克预告过.在愚人节开源出来的推特推荐算法,开源不到 2 天就有了 35k+ 的 star,有意思的是,除了推荐算法本身之外,阅读源码的工程师们甚 ...

  5. 你的梦想家居「GitHub 热点速览」

    上周推荐的 ChatGPT 版小爱,不知道有哪些小伙伴回去尝试接入了呢?本周依旧由 2 个不错的 ChatGPT 延伸项目,一个是比 DeepL.Grammarly 更懂你的划词翻译 openai-t ...

  6. Python 霸榜的一周,又有什么新 AI 力作呢?「GitHub 热点速览」

    GPT 带火了一波语言模型,LLaMA 和 Alpaca 也在持续发力.依旧是各类 GPT 后缀霸榜 GitHub trending 的一周,为此特推部分专门收录了两个比较不错的 GPT 应用.而作为 ...

  7. AI 能多强「GitHub 热点速览」

    不知道 AI 在你那边是什么样的具象,在我这就是各种搞图:从给线稿图上色,到直接给你生成一张小色图,AI 最近是真出风头,本周热点速览也收录了 2 个 AI 项目,也和图像有关.还有一个和 AI 相关 ...

  8. 穷人版生产力工具,好用得飞起 「GitHub 热点速览」

    被 GPT 和 OpenAI 刷屏了一个多月,现在 GitHub Trending 已经没有什么和 gpt 无关的项目了,但是好在总有优秀的开源项目拯救我的项目疲惫.像是贴心好用的反向代理 pgrok ...

  9. 碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

    这周有个让人眼前一亮的图像识别模型 segment-anything,它能精细地框出所有可见物体,它标记出的物体边界线清晰可见.如此出色的模型,自然获得了不少人的赞赏,开源没几天,就拿下了 18k+ ...

  10. 一款能“干掉” ChatGPT 的应用「GitHub 热点速览」

    据说有了它,ChatGPT 就可以靠边站了.因为 Auto-GPT 能更加主动地完成你给他的指定任务,不用做更多的人为干涉,它的推理能力比 ChatGPT 更强,有人用它解放双手做了个 React 网 ...

随机推荐

  1. Windows App SDK? C++/WinRT? 狗都不学!

    空荡荡的官网开发文档,打开直接心凉一截! 只写个Hello World教程就敢宣布自己为"跨时代"新产品? 什么"C++桌面开发者的狂欢"?什么Project ...

  2. c 串口读写数据实例解析

    一 前记 程序员就是不断地砌砖头,然后用砖头,把砖头模块化,用的时候直接调用,能够节省很多精力. 二 实例: 1 #include <stdio.h> 2 #include <uni ...

  3. uniapp踩坑记录

    sessionStorage.setItem('token', data.msg)uni.setStorage('token', res.data); 搞了半天登录后直接通过获取getstorage获 ...

  4. 25_H.264编码

    本文主要介绍一种非常流行的视频编码:H.264. 计算一下:10秒钟1080p(1920x1080).30fps的YUV420P原始视频,需要占用多大的存储空间? (10 * 30) * (1920 ...

  5. C 可变参数函数分析(va_start,va_end,va_list...)

    PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 前置说明   本文作为本人csdn blog的主站的备份.(Bl ...

  6. 【Mahjong hdu 枚举】搜索枚举

    #####枚举 import java.io.*; import java.util.*; public class Main { static HashSet<String> set1; ...

  7. uni-app攻略:如何对接驰腾打印机

    一.引言 在当前的移动开发生态中,跨平台框架如uni-app因其高效.灵活的特点受到了开发者们的青睐.同时,随着物联网技术的飞速发展,智能打印设备已成为许多业务场景中不可或缺的一环.今天,我们就来探讨 ...

  8. 记录--使用Canvas绘制一个验证码组件

    这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 使用Canvas绘制一个验证码组件 前言 验证码,这一日常伴随我们的要素,是我们在线交互的重要安全保障.你的手机短信里是否被它占据半壁江山 ...

  9. 记录--Canvas实现打飞字游戏

    这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 打开游戏界面,看到一个画面简洁.却又富有挑战性的游戏.屏幕上,有一个白色的矩形框,里面不断下落着各种单词,而我需要迅速地输入这些单词.如果 ...

  10. 测试监控系列:使用vb批量统计nmon结果

    适用于一次统计几十台机器的nmon监控结果. 新建excel,在设置里打开开发者工具,点查看代码,把下面代码贴到模块里即可.最后把表格保存为.xlsm Sub for_nmon()'用来统计nmon结 ...