对于 ML 模型训练而言,好的数据集能让结果更健壮,cleanlab 是一个降低数据噪音,及时帮你修正数据集错误的工具。好的工具能让你的结果更完美。同样的,RedTeam-Tools 提高了渗透测试的能力,也间接地让你的安全系统更牢固。DocsGPT 一看便知它是个 Docs + GPT 的结合体,可以提高文档解决用户问题的能力。meilisearch 轻量、速度的检索能力,则提高了 HG 社区的搜索能力。

以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布 | 实用 | 有趣,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知

  • 本文目录

    • 1. 本周特推

      • 1.1 数据集质保:cleanlab
      • 1.2 动画生成器:motion-canvas
    • 2. GitHub Trending 周榜
      • 2.1 文档助手:DocsGPT
      • 2.2 再现塞尔达 3:zelda3
      • 2.3 渗透工具:RedTeam-Tools
      • 2.4 低代码框架:ToolJet
      • 2.5 轻量级搜索引擎:meilisearch
    • 3. 往期回顾

1. 本周特推

1.1 数据集质保:cleanlab

主语言:Python

数据集是每个数据工程师都会经手的东西,那么如果这个数据集本身有问题,很多噪音,后续的模型训练结果就不会多好。而 cleanlab 就能帮你检测 ML 数据集是否有问题,修正里面有问题的 label 以及标记错误的数据。它适用于 Sklearn / PyTorch / TensorFlow / XGBoost 等等框架,一行代码就能找到任意数据集中的数据和标签错误,像这样:

label_issues = cl.find_label_issues(data, labels)

而这行代码能帮你降低数据的噪音,让训练出来的模型更健壮:

cl.fit(data, labels)

GitHub 地址→https://github.com/cleanlab/cleanlab

1.2 动画生成器:motion-canvas

主语言:TypeScript

Motion Canvas 提供了两样东西:

  • 一个用于生成编程动画的 TS 库;
  • 该编程动画的实时预览;

简单来说,它能创建矢量动画,并与旁白同步。在线体验:https://motion-canvas.github.io/editor/quickstart/

GitHub 地址→https://github.com/motion-canvas/motion-canvas

2. GitHub Trending 周榜

2.1 文档助手:DocsGPT

本周 star 增长数:1,450+主语言:Python、HTML

New 这周 ChatGPT 又烧起来了,这把搞点实际的,这是一个借助 GPT 模型帮助那些向文档提问、检索的人快速得到准确、全面的答案。

GitHub 地址→https://github.com/arc53/DocsGPT

2.2 再现塞尔达 3:zelda3

本周 star 增长数:750+主语言:C

塞尔达·众神的三角力量的逆向工程,它用了 7-8 万行 C 代码来重现经典游戏,你可以从头玩到通关。

GitHub 地址→https://github.com/snesrev/zelda3

2.3 渗透工具:RedTeam-Tools

本周 star 增长数:450+

New RedTeam-Tools 供 Red Team 使用的 120+ 技巧和工具,来提高渗透团队的技术实力。下图为其中一个工具的截图:

GitHub 地址→https://github.com/A-poc/RedTeam-Tools

2.4 低代码框架:ToolJet

本周 star 增长数:1,800+主语言:JavaScript、TypeScript

一个低代码框架,可在几分钟内快速构建、部署内部工具。你可以连接到数据库,比如:PostgreSQL、MongoDB、ES 等等;也支持 API 端点(支持导入 OpenAPI spec 和 OAuth2 authorization),也支持对接 SaaS 工具,像 Slack、Notion、Google Sheets 之类的都可以接上,还支持对象存储服务。

GitHub 地址→https://github.com/ToolJet/ToolJet

2.5 轻量级搜索引擎:meilisearch

本周 star 增长数:850+主语言:Rust

一个轻量、快捷的搜索引擎,非常适合在应用程序、网站、workflow 中使用。开箱即用,能在非常短时间内给你检索结果。大家也可以再重温 1 年半前卤蛋写的 「相见恨晚!开源的傻瓜搜索引擎,帮你快速实现搜索功能」

GitHub 地址→https://github.com/meilisearch/meilisearch

3. 往期回顾

往期回顾:

以上为 2023 年第 6 个工作周的 GitHub Trending 如果你 Pick 其他好玩、实用的 GitHub 项目,来 HelloGitHub 和大家一起分享下哟

HelloGitHub 交流群现已全面开放,添加微信号:HelloGitHub001 为好友入群,可同前端、Java、Go 等各界大佬谈笑风生、切磋技术~

如何让程序更健壮「GitHub 热点速览」的更多相关文章

  1. 朋友圈那串神秘字符背后的开源项目「GitHub 热点速览」

    ​如果你这周没刷到类似 "npub1sg6plzptd64u62a878hep2kev88swjh3tw00gjsfl8f237..." 的一串字符,那就说明本期 GitHub T ...

  2. 你的程序员女孩「GitHub 热点速览 v.22.09」

    本周最火的项目要数上周推荐的开源项目 How to Cook,火到一周涨了 18k+ star,但网友对它的定量烹饪方法褒贬不一.在本人看来,烹饪本就是一门"玄学",萝卜青菜各有所 ...

  3. GitHub 桌面版 v3.0 新特性「GitHub 热点速览」

    新版本一般意味着更强的功能特性,比如 GitHub Desktop v3.0.虽然未发布新版本,但本周收录的 7 个开源项目颇有"新版"味.比如,破解(恢复)密码能力 Max 的 ...

  4. 让人眼前一亮的应用「GitHub 热点速览」

    大开眼界的一期 GitHub 热门项目,类似 Django 存在的 pynecone,搞定 Windows.Office 激活的 Microsoft-Activation-Scripts,都让我的收藏 ...

  5. GitHub 公布 2021 Top 10 博文「GitHub 热点速览」

    作者:HelloGitHub-小鱼干 2021 年在这周彻底同我们告别了,在本周的「News 快读」模块你可以看到过去一年 GitHub 的热门文章,其中有我们熟悉的可能让很多程序员"失业& ...

  6. 能动的电脑配件「GitHub 热点速览 v.22.11」

    看到这个标题就知道硬核的 B 站 UP 主稚晖君又更新了,本次带来的是一个造型可爱的小机器人.除了稚晖君这个一贯硬核的软硬件项目之外,本周也有很多有意思的新项目,像 Linux 服务监控小工具 Ray ...

  7. 平平无奇的项目「GitHub 热点速览 v.22.10」

    不知道大家对高星项目什么印象?提到这个词第一个想到哪个项目呢?本周有几个项目看着普普通通,却完成了一周 2k+ star 的事迹.比如 SingleFile,它是个浏览器扩展,点击图标之后即可保存一个 ...

  8. 程序员的情人节「GitHub 热点速览 v.22.07」

    又是一年情人日,刚好还是发文的今天.也没什么好送的,送点程序员的浪漫--代码和开源项目吧.记得在本周特推查收这份来自程序员的独有浪漫. 本周 GitHub 霸榜的项目基本上都是老项目,从老项目中挖点新 ...

  9. 程序员延寿指南「GitHub 热点速览 v.22.17」

    很多人对程序员的固有印象之一便是常加班.易"猝死"!近几年的许多报道似乎也进一步加深了这种印象.应该如何更好地健康地活着.敲喜欢的代码呢?HowToLiveLonger 教你如何从 ...

  10. 一个程序的自我修养「GitHub 热点速览 v.22.19」

    一个程序要诞生涉及前后端技术,比如,你可以用可视化网页搭建工具 tmagic-editor 完成前端部分,而后端部分的数据库以及数据处理可能就要用到 jsonhero-web 和 directus.知 ...

随机推荐

  1. vue3和vue2 的区别,vue3和vu2到底哪个好呢?

    vue3 正式发布有两年多了,之前也做过一些学习和研究.vue3 发布后给某培训机构开发了一套vue3课程课件,自己也开源了一套基于vue3的后台管理系统(因为个人懒的原因,半年后才上传到gitHub ...

  2. Solon v1.11.0 发布,Hello Java

    一个更现代感的 Java 应用开发框架:更快.更小.更自由.没有 Spring,没有 Servlet,没有 JavaEE:独立的轻量生态.主框架仅 0.1 MB. @Controller public ...

  3. Linux下用rm误删除文件的三种恢复方法

    Linux下用rm误删除文件的三种恢复方法 对于rm,很多人都有惨痛的教训.我也遇到一次,一下午写的程序就被rm掉了,幸好只是一个文件,第二天很快又重新写了一遍.但是很多人可能就不像我这么幸运了.本文 ...

  4. day02 数据类型 & 运算符

    day02 数据类型 基本数据类型 共有四类八种 1)整数类型 byte short int long ​ byte: 字节 bit比特,1bit = 1二进制位 ,byte占8位 [-128,128 ...

  5. 【Java EE】Day11 BootStrap、响应式布局、栅格系统、CSS样式、案例

    一.BootStrap介绍 https://v3.bootcss.com/css/#overview 1.概念 基于三剑客开发的前端开发框架 定义了许多css样式和js插件,从而得到丰富的页面效果 依 ...

  6. 金融科技 DevOps 的最佳实践

    随着软件技术的发展,越来越多的企业已经开始意识到 DevOps 文化的重要价值.DevOps 能够消除改变公司业务开展方式,并以更快的速度实现交付,同时创建迭代反馈循环以实现持续改进.而对于金融科技( ...

  7. MyBatis四大参数两种写法

    MyBatis四大参数两种写法 1.在主配置文件中,直接写到value值里面 2.四大参数写入单独配置文件 开始是 为了避免以后其他框架冲突 都加个前缀 jdbc. 主要是红色框里的三个部分 自己定义 ...

  8. [R语言] WGCNA入门教程

    文章目录 wgcna入门-雌性小鼠肝脏表达数据的网络分析:寻找与体重有关的模块 1 数据输入和清洗 1.1 加载基因表达数据 1.2 数据清洗 1.3 加载临床特征数据 2 建设表达网络与模块检测 2 ...

  9. Java学习笔记:2021年12月31日下午-2022年1月1日上午

    Java学习笔记:2021年12月31日下午-2022年1月1日上午 摘要:主要记录了计算机的电气构成,学习Linux系统的原因以及关于Linux以及相关操作的基础知识. 目录 Java学习笔记:20 ...

  10. 低版本客户端连接高版本数据库报错ORA-28040、ORA-01017

    测试环境: 客户端:Oracle 11.2.0.1 服务端:Oracle 19.16 测试过程: 1.低版本客户端连接高版本数据库报错ORA-28040 2.低版本客户端连接高版本数据库报错ORA-0 ...