Hugging News 年度特刊: Transformers & Gradio 年终大事件总结
Transformers 年终大事件总结
对于 Transformers 来说,这是激动人心的一年。2022 年,我们的每周活跃用户数量增加了两倍,最近的一周用户超过 100 万,平均每日 pip 安装量为 30 万
我们在音频、文本、视觉️、多模态甚至时间序列和蛋白质折叠场景下支持的模型架构数量增加了一倍(89 到 167)
以下是这些新模型中的一些亮点
一月份,我们支持了 Swin Transformer 一个来自 @MSFTResearch 的视觉模型。它可以用作图像分类、对象检测或语义分割等各种任务的骨干。
https://huggingface.co/docs/transformers/model_doc/swin
OPT 由 @Meta AI 于去年五月加入。它是一系列与 GPT3 大小相似的开源大型因果语言模型 (Causal Language Modeling)。
BLOOM 于 6 月由 @BigscienceW 发布。它是一个类似的系列模型,是在 46 种语言上训练的。
https://huggingface.co/docs/transformers/model_doc/bloom
LayoutLM v3(也来自 @MSFTResearch) 于 6 月添加到库中。它是一种结合视觉和文本的多模态模型,用于文档分析。
10 月,Whisper,来自 @OpenAI 的语音识别模型已添加到库中:
https://huggingface.co/docs/transformers/model_doc/whisper
Transformers 连续第二年在 Stack Overflow 调查中被评为最受喜爱的框架
https://survey.stackoverflow.co/2022
2022 年主分支有将近 3,000 次提交!如果没有整个社区,这是不可能的:一半的新架构是由社区贡献者添加的,我们有 500 多个新贡献者。
我们期待 2023 年带来更多令人兴奋的新模型!
Gradio 年终大事件总结
2022 年对 Gradio 团队来说是重要的一年! 从主要更新和新功能到合作伙伴关系和里程碑,这里我们简要回顾 2022 年的主要发布。跟着一起重温一下吧。
随着 Gradio 2.7.5 的发布拉开了这一年的序幕 这个更新的一些亮点包括将整个后端迁移到 @FastAPI 并添加为 FLAG 按钮编写自定义回调的功能。
1 月,HF 宣布与 CVPR 2022 建立合作伙伴关系,为 Gradio 演示提供专用场所。
二月,Gradio将前端从 React 迁移到 @Sveltejs, 希望大家都像我一样喜欢这些 Gradio 改进。
二月对 Gradio 团队来说是忙碌的一个月。他们在 GitHub 存储库上获得了 5000 颗星,并在 Demo 之上添加了 Markdown 支持。团队还宣布了最新的组件:聊天机器人!使用它在几行 Python 代码中为您的对话模型构建一个交互式、可共享的演示。
2 月的尾声伴随着 v2.8.1 的发布 这个版本的新功能包括:多语言支持(Demo 开始根据观众的浏览器语言偏好支持开箱即用的国际化,发布时支持 14 种语言),以及网站上发布的 /Guides 教程页面
三月对 Gradio 团队来说是个重要的月份!他们达到了一个重要的里程碑,使用 Gradio 构建了 500,000 个演示,然后发布了 Gradio 2.9 此更新包括对流式语音识别模型的支持,只需几行代码。
四月是令人兴奋的发布月份。 Gradio 引入了 Image3D,一个新的输入和输出组件,适用于所有网格和 3d 对象 它可以开箱即用地处理 .obj
、.glb
和 .gltf
文件 团队还分享了他们的最新组件:Plot
5 月,我们看到了 Gradio 产品的重大更新。随着 Gradio 3.0 的发布! 新的块 (blocks) 功能允许您从 Python 构建复杂的 Demo,并完全控制布局、数据流和状态。 Gradio 每月下载量达到 25 万次,并在 HF 阵容中添加了一门课程。
Gradio 还引入了重新加载模式 (reload mode),允许您的网络应用程序在您开发和更改代码时刷新 另一个重大更新是:能够创建 PR 以改进任何关于 Hugging Face Spaces 的 Gradio Demo
Gradio 达到了 7400 个 GitHub star 的里程碑!
v3.1 发布了重大更新:原生嵌入(embedding)、使用重新加载模式更快地开发、修复演示、Dataframes 中的 HTML 和 Markdown 支持、音频/图像流。 还新加入了用于手机数据集和反馈的标记 (Flag) 按钮 ️
接下来的 Gradio 版本有很多改进!输出视频现在可以在浏览器中播放,更好地排队进行并发预测,并修复了 Gallery、Model3D 和 Examples 重大更新:通过在浏览器关闭时将用户从队列中移除,来帮助更快的执行 Demo
下一个版本中 Gradio 改进了队列系统以更好地管理 Spaces 上的队列,修复了 Examples 组件以获得更清晰的视图,组件修复包括可在浏览器中播放的视频以及设置图像高度/宽度的能力 同时增加了随机输入滑块的能力,在页面加载时重新加载数据。
Gradio 发布了 v3.3 的重大更新! 新的迭代输出功能让您产生一系列输出新的手风琴 (Accordion) 布局 新的 Skops 集成允许直接从 Hub 加载模型 网站的演示部分现在展示了流行的文本、图像、音频和表格 ML 工作流程
Gradio 随后发布了具有新功能的 3.4 版本!️ Gallery 现在支持标题, Slider 现在支持可键入的值,以及 对图像组件进行了大量更改,以改进素描和 inpainting 支持。
Gradio 达到 一万个 GitHub 的星星数量,每日下载量达到五万次!
Gradio 10 月发布了 Gradio 3.4.1!Gradio Changelog 发布,以使用新的发布历史记录功能跟踪所有更改。音频流在 Gradio 应用程序中完全可用
另一个重要的里程碑——每月超过 100 万次下载。 稍后 Gradio 发布了 v3.5,具有支持拖放图像和 gr.Dataset
组件中的 HTML/Markdown 支持等新功能。 在 Gradio 3.6 中,团队增加了取消活跃队列的功能 (cancel running events)!
十月 v3.7 添加了对批处理功能的支持,以加速 Spaces 上的演示 ️视频、音频、图像和文件组件可以获得上传事件
v3.8 使使用 dict
变得更加容易。块 (blocks) 功能中的输入并添加了定时运行事件的能力
11 月对于 Gradio 来说是忙碌的一个月,发布了令人兴奋的版本:
与 ArXiv 合作,提供带有论文的机器学习 Demo
通过 Colab 集成提高了安全性
️ 在 Colab 笔记本中运行本地应用程序提高了速度
向文本框添加“密码”和“电子邮件”类型”
Gradio 3.11.0 大获成功,带来了更棒的新功能:
UploadButton 首次亮相,一个时尚的文件上传按钮组件
修复 Bug: 通过 WebSockets 发送的文件大小从 16MB 增加到 1GB
我们新的“通过 API 使用”功能 (Use via API) 使使用 Space 作为 API 来测试有效载荷变得容易
十一月,Gradio 3.12 和 3.13 带来了惊人的更新:
LaTeX 支持 gr.Markdown
️ Chatbot 现在支持图像和 Markdown
gr.ScatterPlot 具有单行代码和响应式设计
Plot 组件现在也接受 Altair 绘图!(Van-Gogh twist 到下面的“散点图”)
Gradio 3.13.1、3.14 和 3.15 带来了重大更新:
以 .gradio.live 结尾的安全、高带宽可共享链接
音频分享的波形可视化支持
每个组件中的“每个”参数使实时仪表板变得容易
️gr.LinePlot 用于时间序列可视化
对于 Gradio 团队来讲这是了不起的一年!
每月下载量达到 100 万次,Github 星数达到 10,000 颗。
引入了与 ArXiv 合作的 Blocks API,添加了新组件,例如 gr.Image3D、gr.ScatterPlot 和 gr.LinePlot 等等!
感谢 Gradio 团队和社区的出色工作,我们迫不及待地想看看未来会怎样。 为未来的持续成功和创新干杯。
所有图片均来自 Anzorq @hahahahohohe 和 @huggingface
https://huggingface.co/spaces/anzorq/finetuned_diffusion
红包封面“补货”啦!
谢谢大家对我们红包封面的喜爱,请在微信公众号后台回复「红包」或者「红包封面」获取我们的设计师茶叶蛋蛋为大家设计的 Hugging Face 红包封面!
Hugging Face 公众号春节放假通知
根据《国务院办公厅关于 2023 年部分节假日安排的通知》精神,2023 年春节放假具体安排为:1 月 21 日(星期六)至 27 日(星期五)放假调休,共 7 天。1 月 28 日 (星期六)、1 月 29 日 (星期日) 上班。
放假 (调休) 期间暂不发文,1 月 28 日 (星期六)、1 月 29 日 (星期日) 上班日这两天也不发文,正式恢复发文的时间为 1 月 30 日。
兔年祝福
祝愿大家可以有一个幸福和睦、温馨祥和、平安快乐的兔年春节。希望我们大家 2023 年能够去到任何想去的地方,与每一个爱着自己和关心自己人热情相拥,大胆勇敢的追求自己内心的向往,愿大家心之所向,皆为所愿!
Hugging News 年度特刊: Transformers & Gradio 年终大事件总结的更多相关文章
- 回顾 2020 年 GitHub 的大事件,你知道多少?
作者:HelloGitHub-小鱼干 这里是 HelloGitHub 出品的年度盘点系列,本期我们将盘点 GitHub 在 2020 发生的大事件,回顾一下今年 GitHub 给我们带来了那些惊喜.故 ...
- [译] AlphaGo 的确是一个大事件
[译] AlphaGo 的确是一个大事件 转自:http://www.jianshu.com/p/157a15de47df 字数3797 阅读696 评论0 喜欢4 作者:Michael Nielse ...
- hadoop大事件
大事件: Hadoop新一代(2.x)计算平台YARN 一代hadoop存在的问题: 1.Jobtracker单点,容易导致崩溃,节点较多时造成性能瓶颈 2.作业分配基于槽位(slot),分配粒度 ...
- 60行python代码分析2018互联网大事件
2018年是改革开放四十周年,也是互联网发展的重要一年.经历了区块链,人工智能潮的互联网行业逐渐迎来了冬天.这一年里有无数的事件发生着,正好学了python数据处理相关,那么就用python对18年的 ...
- 你是猴子请来的逗比么!IT跳槽大事件
3月招聘大战早已硝烟四起,互联网职场摇身一变成了跳蚤市场,猎头们告诉跳蚤们,跳不跳不是不问题,往哪儿跳才是重点,跳对了高薪期权都如过眼云烟.不过小编不得不说,劳资最痛恨那些跳槽的人啦!就因为加班 ...
- 团队nabcd(校园大事件)
我们团队项目名称是TD校园通,作为辅助功能校园大事件,一样是一个亮眼的功能. 我们的大事件功能主要解决了大家qq微信群聊过多,信息杂,很多时候错过了校园内的大事件,错失了好的活动的痛苦. 我们计划在主 ...
- HTML5行业现状与未来 - 2016年终大盘点
* { margin: 0; padding: 0 } .con { width: 802px; margin: 0 auto; text-align: center; position: inher ...
- 基于 Hugging Face Datasets 和 Transformers 的图像相似性搜索
基于 HuggingFace Datasets 和 Transformers 的图像相似性搜索 通过本文,你将学习使用 Transformers 构建图像相似性搜索系统.找出查询图像和潜在候选图像之间 ...
- 大事件,Java被超越了,2021年5月TIOBE编程语言排行榜出炉
TIOBE 头条 TIOBE 5月编程语言排行榜新鲜出炉.前十榜单中,C.Python.Java三大鳌头仍占据前三榜单.去年11月,Python短时间的挤掉Java跃居至榜单第二名:今年5月,Pyth ...
- 大事件回顾 | Eolink 5月重要动态速览!
在春天和夏天中间悄然而至的 5 月刚刚过去,及时求变,在呼啸而过的时代中保持竞争力的 Eolink 最近又有哪些大动作呢?下面我们梳理了5月以来 Eolink 的重要动态,给大家提供阅览. 01 ** ...
随机推荐
- 从HumanEval到CoderEval: 你的代码生成模型真的work吗?
本文分享自华为云社区<从HumanEval到CoderEval: 你的代码生成模型真的work吗?>,作者:华为云软件分析Lab . 本文主要介绍了一个名为CoderEval的代码生成大模 ...
- docker启动完美容器的过程
这里是我用docker启动所有常见的容器完美的过程,就是一次创建,后面就可以一直使用 文档: nanshaws/docker-everything: 用docker来创建各种容器,完美文档教你按照步骤 ...
- 后端程序员必会的前端知识-03:Vue2
三. Vue 2 1. Vue 基础 1) 环境准备 安装脚手架 npm install -g @vue/cli -g 参数表示全局安装,这样在任意目录都可以使用 vue 脚本创建项目 创建项目 vu ...
- IDEA创建Springboot项目在application.yml配置文件配置了nacos远程注册中心,启动项目还是找localhost的问题
项目结构如下: 报错如下: 解决办法: # 错误的 #spring.cloud.nacos.config.server-addr=192.168.137.137:8848 #spring.cloud. ...
- python操作mongodb实现读写分离
读写分离 默认情况下,MongoClient 实例将查询发送到副本集的主要成员. 要使用副节点作为查询,以实现读写分离,我们必须更改读取首选项: 读取首选项在模块pymongo.ReadPrefere ...
- Semantic Kernel 正式发布 v1.0.1 版本
微软在2023年12月19日在博客上(Say hello to Semantic Kernel V1.0.1)发布了Semantic kernel的.NET 正式1.0.1版本.新版本提供了新的文档, ...
- URL安全的Base64算法
URL安全的Base64算法 base64是取3个字节(24位)的数据强行组成4个字节(32位)的数据做为一个分组,24位分成4个字节的话,每个字节分到6位,然后前面补两位0,然后这个字节的值位索引去 ...
- 酷表ChatExcel -北大出品免费自动处理表格工具
酷表ChatExcel是通过文字聊天实现Excel的交互控制的AI辅助工具,期望通过对表输入需求即可得到处理后的数据(想起来很棒),减少额外的操作,辅助相关工作人员(会计,教师等)更简单的工作.Cha ...
- ElasticSearch之健康状态
参考Cluster health API. 命令样例,如下: curl -X GET "https://localhost:9200/_cluster/health?wait_for_sta ...
- 关于windows激活程序的木马病毒分析及处置方法
客户电脑中毒,锁定几个病毒进程.EDR杀毒.木马专杀工具无法处置,该现象是和深信服外网AF防火墙联动后发现的行为,EDR无感知. 该病毒特征为,每日早上用户开机,均检查到外链du.testjj.com ...