Hugging News #0512: 🤗 Transformers、🧨 Diffusers 更新,AI 游戏是下个新热点吗
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!
开源更新
Transformers 现已支持 Meta 的 SAM 分割模型

你还可以使用自动遮罩生成管道预测给定图像的分割掩码,并提供一组边界框或一组 2D 点,以预测感兴趣的对象的分割掩码,只需调用 AutoModel.from_pretrained 即可。
查看 Notebook: 在 transformers 中使用 Segment Anything Model:
https://ipynb.cn/github/huggingface/notebooks/blob/main/examples/segment_anything.ipynb
TPU YYDS: 做完一个小时的音频转录只需要 15 秒!

我们的一位同事 Sanchit 为 OpenAI 的 Whisper 模型提供了 JAX 实现,代码兼容 CPU、GPU 和 TPU,可以部署为用于音频处理的推理端点,也可以批处理单个音频文件。
GitHub 地址:
https://github.com/sanchit-gandhi/whisper-jax
更轻松地微调 TTS 模型

transformers 已经增加了在文本到语音中微调 SpeechT5 模型的功能。
你可以在这个 Colab 中查看详细操作步骤:
https://colab.research.google.com/drive/1i7I5pzBcU3WDFarDnzweIj4-sVVoIUFJ
在 diffusers 上进行 Multi-concept 主题训练

现在你可以通过 Custom Diffusion 在 diffusers 上进行 Multi-concept 主题训练,上图展示了结合木头和猫咪的图片。Custom Diffusion 只微调 UNet 的交叉注意力层,同时支持在消费者硬件上无缝学习的文本反演融合。因此,仅用 250 步,我们就可以得到相当好的结果。
Custom Diffusion 文档: https://hf.co/docs/diffusers/main/en/training/custom_diffusion
产品更新
Gradio 新增 gradio_client 库

现在,你可以使用 gradio_client 库将任意一个 Gradio 应用以 API 方式调用。
Space 模版现已支持 AimStack

现在,你可以在新建 Space 应用的时候选择 AimStack 这个 Docker 模版,Aim 是一个开源的、自托管的 AI 元数据跟踪工具,它为探索和比较元数据提供了一个性能强大的用户界面,以及一个用于编程访问的、非常适合自动化的 SDK。在 Space 应用上构建一个 Aim 应用,你可以随时与他人共享训练结果,用于探索和比较元数据,以及以编程方式访问跟踪的元数据。
推理端点大更新

端点启动 / 创建时间减少了约 4-6 倍,你可以在 1 分钟内完成 BERT、10 分钟内完成 FLAN-T5-XXL (11B) 推理等。
轻松地在你的游戏里加入数万个开源模型

本周,我们发了一篇文章,介绍如何 在 Space 应用中使用 Unity API,邀请你回顾这篇文章,敬请期待更多 AI 游戏的文章和产品发布。
以上就是本期 Hugging News,本周日是母亲节,请用任何方式告诉亲爱的妈妈:我爱你!️
Hugging News #0512: 🤗 Transformers、🧨 Diffusers 更新,AI 游戏是下个新热点吗的更多相关文章
- Serpent.AI – 游戏代理框架(Python)
Serpent.AI - 游戏代理框架(Python) Serpent.AI是一个简单而强大的新颖框架,可帮助开发人员创建游戏代理.将您拥有的任何视频游戏变成一个成熟的实验的沙箱环境,所有这些都是熟悉 ...
- Serpent.AI - 游戏代理框架(Python)
Serpent.AI - 游戏代理框架(Python) Serpent.AI是一个简单而强大的新颖框架,可帮助开发人员创建游戏代理.将您拥有的任何视频游戏变成一个成熟的实验的沙箱环境,所有这些都是熟悉 ...
- 2019微软Power BI 每月功能更新系列——2月Power BI 新功能学习
哈喽,小伙伴们,我是小悦悦,好久不见~ 春节假期结束,新一轮的工作开始,祝大家猪年如意,开工大吉! 今天小悦悦带你走入猪年学习的正确打开方式——Power BI新一年的持续更新学习! Power ...
- 分析苹果代充产业链 汇率差+退款造就三线城市千万富翁_中新游戏研究_Joynews中新游戏
分析苹果代充产业链 汇率差+退款造就三线城市千万富翁_中新游戏研究_Joynews中新游戏 CNG:近日有媒体曝出8月22日这一天,有一家淘宝店卖出了351张面值4000南非南特的App Store ...
- 【转载】NeurIPS 2018 | 腾讯AI Lab详解3大热点:模型压缩、机器学习及最优化算法
原文:NeurIPS 2018 | 腾讯AI Lab详解3大热点:模型压缩.机器学习及最优化算法 导读 AI领域顶会NeurIPS正在加拿大蒙特利尔举办.本文针对实验室关注的几个研究热点,模型压缩.自 ...
- 微软Power BI 每月功能更新系列——12月Power BI 新功能学习
Power BI Desktop12月产品功能摘要 Power BI 作为实力宠粉达人每月更新不来点新花样,怎么对得起翘首期待的实力铁粉您嘞!一起来看看这一次的Power BI版本的更新又给我们带来了 ...
- 微软Power BI 每月功能更新系列——11月Power BI 新功能学习
Power BI Desktop11月产品功能摘要 本月Power BI Desktop 有一个大规模的更新.现在,通常可以使用复合模型在一个模型中将直接查询和导入源组合在一起.UserVoice上的 ...
- 微软Power BI 每月功能更新系列——10月Power BI 新功能学习
Power BI Desktop10月产品功能摘要 本月Power Plus Desktop的更新充满了整个产品的小型和大型改进.一个巨大的更新是Power BI服务支持我们的复合模型和聚合预览.这实 ...
- 微软Power BI 每月功能更新系列——4月Power BI 新功能学习
本月Power BI Desktop的更新,除了常规的视觉和数据连接器改进之外,还有两个非常大的功能改进,交互式的报表.问答,用户直接在Desktop可以询问有关的数据问题,面对层出不穷的用户需求,这 ...
- 微软Power BI 每月功能更新系列——5月Power BI 新功能学习
Power BI Desktop 5月份功能摘要 本月Power BI Desktop除了许多报表功能的更新,Power BI对条件格式进行了重大改进,可以对报表的任何字段(包括字符串和日期)进行条件 ...
随机推荐
- C# 微信开发 微信号接入 (附完整源码)(1)
1. 首先配置微信服务器设置 a) 企业号配置信息 (详见:ConfigurationManager类) b) 企业号服务器配置: ConfigurationManager ...
- python字符操作超全总结
在python中,字符串是数据类型之一,属于不可变序列. 转义字符的使用 转义字符是指使用反斜杠"\"对一些特殊字符进行转义.几个常用的转义字符如下: \ -续行 \n -换行 ...
- LoadRunner——安装教程以及创建与录制(一)
theme: channing-cyan 1. loadrunner12|loadrunner12官方版下载(附安装教程)+网盘下载+汉化包 CSDN下载及安装教程: https://blog.csd ...
- .NET中委托性能的演变
.NET中的委托 .NET中的委托是一项重要功能,可以实现间接方法调用和函数式编程. 自.NET Framework 1.0起,委托在.NET中就支持多播(multicast)功能.通过多播,我们可以 ...
- 组合构造和对应的OGF/EGF Dictionary 备查
目录 Constructions Cycle Multiset construction Powerset construction Admissible unlabelled constructio ...
- 恰好经过k条边的最短路
需要用到离散数学中关于关系矩阵的运算的知识 一个表示一个图中任意两点间经过2条边最短路的关系矩阵的平方表示的是任意两点间经过4条边的最短路的关系矩阵 原因在于当我们选定中间点时,路径的前半部分和后半部 ...
- 用Python基于Google Bard做一个交互式的聊天机器人
用Python基于Google Bard做一个交互式的聊天机器人 之前已经通过浏览器试过了 Google Bard ,更多细节请看: Try out Google Bard, Will Google ...
- $\mathcal{Crypto}$ 共模攻击原理实现以及$\mathcal{CRT}$优化
\(\mathcal{共模攻击概述}\) 共模攻击是一种攻击 \(\mathcal{RSA}\) 加密的技术,当两个密文使用相同的 \(\mathcal{RSA}\) 公共模数时,攻击者可以使用中国剩 ...
- hta--Windows运行html的桌面应用程序(HTML应用程序)
HTA(HTML Application)-- HTML应用程序 作为前端开发,我们能熟练使用html实现各种效果,但是如果要实现一个简单的桌面应用程序那么应该怎么做呢,答案很简单,只需要把html文 ...
- Linux线程同步必知,常用方法揭秘!
一.为什么要线程同步 在Linux 多线程编程中,线程同步是一个非常重要的问题.如果线程之间没有正确地同步,就会导致程序出现一些意外的问题,例如: 竞态条件(Race Condition):多个线程同 ...