对于 ML 模型训练而言,好的数据集能让结果更健壮,cleanlab 是一个降低数据噪音,及时帮你修正数据集错误的工具。好的工具能让你的结果更完美。同样的,RedTeam-Tools 提高了渗透测试的能力,也间接地让你的安全系统更牢固。DocsGPT 一看便知它是个 Docs + GPT 的结合体,可以提高文档解决用户问题的能力。meilisearch 轻量、速度的检索能力,则提高了 HG 社区的搜索能力。

以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布 | 实用 | 有趣,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知

  • 本文目录

    • 1. 本周特推

      • 1.1 数据集质保:cleanlab
      • 1.2 动画生成器:motion-canvas
    • 2. GitHub Trending 周榜
      • 2.1 文档助手:DocsGPT
      • 2.2 再现塞尔达 3:zelda3
      • 2.3 渗透工具:RedTeam-Tools
      • 2.4 低代码框架:ToolJet
      • 2.5 轻量级搜索引擎:meilisearch
    • 3. 往期回顾

1. 本周特推

1.1 数据集质保:cleanlab

主语言:Python

数据集是每个数据工程师都会经手的东西,那么如果这个数据集本身有问题,很多噪音,后续的模型训练结果就不会多好。而 cleanlab 就能帮你检测 ML 数据集是否有问题,修正里面有问题的 label 以及标记错误的数据。它适用于 Sklearn / PyTorch / TensorFlow / XGBoost 等等框架,一行代码就能找到任意数据集中的数据和标签错误,像这样:

label_issues = cl.find_label_issues(data, labels)

而这行代码能帮你降低数据的噪音,让训练出来的模型更健壮:

cl.fit(data, labels)

GitHub 地址→https://github.com/cleanlab/cleanlab

1.2 动画生成器:motion-canvas

主语言:TypeScript

Motion Canvas 提供了两样东西:

  • 一个用于生成编程动画的 TS 库;
  • 该编程动画的实时预览;

简单来说,它能创建矢量动画,并与旁白同步。在线体验:https://motion-canvas.github.io/editor/quickstart/

GitHub 地址→https://github.com/motion-canvas/motion-canvas

2. GitHub Trending 周榜

2.1 文档助手:DocsGPT

本周 star 增长数:1,450+主语言:Python、HTML

New 这周 ChatGPT 又烧起来了,这把搞点实际的,这是一个借助 GPT 模型帮助那些向文档提问、检索的人快速得到准确、全面的答案。

GitHub 地址→https://github.com/arc53/DocsGPT

2.2 再现塞尔达 3:zelda3

本周 star 增长数:750+主语言:C

塞尔达·众神的三角力量的逆向工程,它用了 7-8 万行 C 代码来重现经典游戏,你可以从头玩到通关。

GitHub 地址→https://github.com/snesrev/zelda3

2.3 渗透工具:RedTeam-Tools

本周 star 增长数:450+

New RedTeam-Tools 供 Red Team 使用的 120+ 技巧和工具,来提高渗透团队的技术实力。下图为其中一个工具的截图:

GitHub 地址→https://github.com/A-poc/RedTeam-Tools

2.4 低代码框架:ToolJet

本周 star 增长数:1,800+主语言:JavaScript、TypeScript

一个低代码框架,可在几分钟内快速构建、部署内部工具。你可以连接到数据库,比如:PostgreSQL、MongoDB、ES 等等;也支持 API 端点(支持导入 OpenAPI spec 和 OAuth2 authorization),也支持对接 SaaS 工具,像 Slack、Notion、Google Sheets 之类的都可以接上,还支持对象存储服务。

GitHub 地址→https://github.com/ToolJet/ToolJet

2.5 轻量级搜索引擎:meilisearch

本周 star 增长数:850+主语言:Rust

一个轻量、快捷的搜索引擎,非常适合在应用程序、网站、workflow 中使用。开箱即用,能在非常短时间内给你检索结果。大家也可以再重温 1 年半前卤蛋写的 「相见恨晚!开源的傻瓜搜索引擎,帮你快速实现搜索功能」

GitHub 地址→https://github.com/meilisearch/meilisearch

3. 往期回顾

往期回顾:

以上为 2023 年第 6 个工作周的 GitHub Trending 如果你 Pick 其他好玩、实用的 GitHub 项目,来 HelloGitHub 和大家一起分享下哟

HelloGitHub 交流群现已全面开放,添加微信号:HelloGitHub001 为好友入群,可同前端、Java、Go 等各界大佬谈笑风生、切磋技术~

如何让程序更健壮「GitHub 热点速览」的更多相关文章

  1. 朋友圈那串神秘字符背后的开源项目「GitHub 热点速览」

    ​如果你这周没刷到类似 "npub1sg6plzptd64u62a878hep2kev88swjh3tw00gjsfl8f237..." 的一串字符,那就说明本期 GitHub T ...

  2. 你的程序员女孩「GitHub 热点速览 v.22.09」

    本周最火的项目要数上周推荐的开源项目 How to Cook,火到一周涨了 18k+ star,但网友对它的定量烹饪方法褒贬不一.在本人看来,烹饪本就是一门"玄学",萝卜青菜各有所 ...

  3. GitHub 桌面版 v3.0 新特性「GitHub 热点速览」

    新版本一般意味着更强的功能特性,比如 GitHub Desktop v3.0.虽然未发布新版本,但本周收录的 7 个开源项目颇有"新版"味.比如,破解(恢复)密码能力 Max 的 ...

  4. 让人眼前一亮的应用「GitHub 热点速览」

    大开眼界的一期 GitHub 热门项目,类似 Django 存在的 pynecone,搞定 Windows.Office 激活的 Microsoft-Activation-Scripts,都让我的收藏 ...

  5. GitHub 公布 2021 Top 10 博文「GitHub 热点速览」

    作者:HelloGitHub-小鱼干 2021 年在这周彻底同我们告别了,在本周的「News 快读」模块你可以看到过去一年 GitHub 的热门文章,其中有我们熟悉的可能让很多程序员"失业& ...

  6. 能动的电脑配件「GitHub 热点速览 v.22.11」

    看到这个标题就知道硬核的 B 站 UP 主稚晖君又更新了,本次带来的是一个造型可爱的小机器人.除了稚晖君这个一贯硬核的软硬件项目之外,本周也有很多有意思的新项目,像 Linux 服务监控小工具 Ray ...

  7. 平平无奇的项目「GitHub 热点速览 v.22.10」

    不知道大家对高星项目什么印象?提到这个词第一个想到哪个项目呢?本周有几个项目看着普普通通,却完成了一周 2k+ star 的事迹.比如 SingleFile,它是个浏览器扩展,点击图标之后即可保存一个 ...

  8. 程序员的情人节「GitHub 热点速览 v.22.07」

    又是一年情人日,刚好还是发文的今天.也没什么好送的,送点程序员的浪漫--代码和开源项目吧.记得在本周特推查收这份来自程序员的独有浪漫. 本周 GitHub 霸榜的项目基本上都是老项目,从老项目中挖点新 ...

  9. 程序员延寿指南「GitHub 热点速览 v.22.17」

    很多人对程序员的固有印象之一便是常加班.易"猝死"!近几年的许多报道似乎也进一步加深了这种印象.应该如何更好地健康地活着.敲喜欢的代码呢?HowToLiveLonger 教你如何从 ...

  10. 一个程序的自我修养「GitHub 热点速览 v.22.19」

    一个程序要诞生涉及前后端技术,比如,你可以用可视化网页搭建工具 tmagic-editor 完成前端部分,而后端部分的数据库以及数据处理可能就要用到 jsonhero-web 和 directus.知 ...

随机推荐

  1. Selenium4+Python3系列(八) - Cookie、截图、单选框及复选框处理、富文本框、日历控件操作

    我所在的城市昨天出了近20+的阳性案例,但这丝毫没有 "影响" 到996的工作时间,当然,也没有影响到我想继续更新文章的决心. 一.cookie常用操作入门 上一篇有写过关于coo ...

  2. linux配置 python 开发环境sublime text及一些使用心得

    前言 一直以来我都使用 sublime text 作为主流开发的 ide ,但其实我开始在我的 linux mint 系统使用 sublime text 配置 python3 的开发环境踩过的坑又何止 ...

  3. 关于mysql命令的学习

    前言 这篇文章我不会具体说明哪些操作有哪些命令,我只说明这些命令的记忆方法.其实知道原理后,这些命令尽管多,但都是有据可循的 mysql提示符 可以通过登录时加入 –prompt 提示符内容 参数 登 ...

  4. github上fork2.4k,star8.7k的这款状态机,原来长这样!

    大家好,我是陶朱公Boy. 前言 上一篇文章<关于状态机的技术选型,最后一个真心好>我跟大家聊了一下关于"状态机"的话题. 于是就有小伙伴私信我,自己项目也考虑引入co ...

  5. day29 jQuery选择器 & jquery属性操作 & jquery DOM元素 操作与遍历

    简介 jQuery,顾名思义,就是javascript和query(查询),即辅助javascript开发的库,本质就是一个js文件: jQuery是一个js函数库,是目前全球范围内最流行.用的最多的 ...

  6. MySQL进阶实战5,为什么查询速度会慢

    一.先了解一下MySQL查询的执行过程 MySQL在查询时,它是由很多子任务组成的,每个子任务都会消耗一定的时间,如果要想优化查询,实际上要优化其子任务,可以消除一些子任务.减少子任务的执行次数.让子 ...

  7. 【大数据面试】【项目开发经验】Hadoop、Flume、Kafka、Hive、MySQL、Sqoop、Azkaban、Spark

    主要内容:框架层面的调优.业务经验 一.Hadoop 1.Hadoop基准测试(HDFS的读写性能.MapReduce的计算能力测试) (1)测试内容:文件上传下载的时间 (2)服务器有几个硬盘插槽 ...

  8. python安装包出现的两个问题error: Unable to find vcvarsall.bat、提示No module named Crypto.Cipher

    python安装包出现的两个问题 error: Unable to find vcvarsall.bat No module named Crypto.Cipher error: Unable to ...

  9. 深入理解 MySQL 的事务隔离级别和 MVCC 机制

    前言 我们都知道 MySQL 实现了 SQL 标准中的四个隔离级别,但是具体是如何实现的可能还一知半解,本篇博客将会从代码层面讲解隔离级别的实现方式,下面进入正题. 事务 考虑这样一个场景:博主向硝子 ...

  10. 【FAQ】在华为鸿蒙车机上集成华为帐号的常见问题总结

    随着新一代信息技术与汽车产业的深度融合,智能网联汽车正逐渐成为汽车产业发展的战略制高点,无论是传统车企还是新势力都瞄准了"智能座舱"这种新一代人机交互方式.面对竞争如此激烈的车机市 ...