在人工智能技术领域,GPU 资源一直是推动研究和应用的关键因素。然而,GPU 的成本和可用性对于许多研究人员和开发者来说却是一个显著的障碍。

在 Hugging Face,我们希望人工智能技术可以更加普惠化,更多开发者可以参与其中共同探索,在人工智能技术浪潮中创造出让更多人受益的产品。

为此,我们计划提供 1000 万美元的免费共享 GPU,借以推动下一波的人工智能创新。

什么是 ZeroGPU?

ZeroGPU 是 Hugging Face 的 Spaces 平台的一种新型硬件集成,设计有两个主要目标:

  1. 为 Spaces 应用提供免费的 GPU 访问;
  2. 允许 Space 应用在多个 GPU 上运行,提高性能和效率。

通过一个动态系统实现,Space 应用可以根据需要高效地持有和释放 GPU,而不受限于单个 GPU。ZeroGPU 采用强大的 Nvidia A100 GPU,每个设备提供 40GB 的显存,确保复杂工作负载的高性能。

兼容性和使用

ZeroGPU Spaces 旨在与大多数基于 PyTorch 的 GPU Spaces 兼容,尤其是 Hugging Face 库如 transformers 或 diffusers。然而,由于其使用较新的架构,ZeroGPU Spaces 可能比传统的 GPU Spaces 遇到更多的错误。目前,ZeroGPU 仅兼容 Gradio SDK,并推荐使用以下版本以确保最佳性能:

  • Gradio: v4+ 版本
  • PyTorch: 2.0.0 至 2.2.0 版本
  • Python: 3.10.13

要集成 ZeroGPU,需要在要使用 ZeroGPU 处理的 Python 函数前使用 @spaces.GPU 这个 decorator (装饰器) 。

这个装饰器确保函数执行期间分配 GPU,并在执行完毕后立即释放。以下是如何在 Space 中设置 GPU 支持函数的示例:

import spaces
from diffusers import DiffusionPipeline pipe = DiffusionPipeline.from_pretrained(...)
pipe.to('cuda') @spaces.GPU
def generate(prompt):
return pipe(prompt).images gr.Interface(
fn=generate,
inputs=gr.Text(),
outputs=gr.Gallery(),
).launch()

这种设置不仅优化了资源使用,还简化了 AI 模型的部署。

增强的可访问性

ZeroGPU 对所有用户开放,PRO 用户还可以托管自己的 ZeroGPU Spaces。为了帮助开发过程,Hugging Face 鼓励用户通过社区标签提供反馈,并探索已经可用的 ZeroGPU Spaces列表。

对于需要较长执行时间的函数,开发者可以在 @spaces.GPU 装饰器中指定持续时间参数,将GPU分配时间延长到最多 120 秒,以适应更密集的计算需求。

开始使用

注册用户可以在 Spaces 页面选择创建 Space,选择使用 Gradio SDK,Space Hardware 选择 Zero NVIDIA A100 即可。

期待反馈

我们希望开发者们可以将这个消息分享给身边的朋友,如果有任何反馈,请随时在文章里留言让我们知道!

Hugging Face ZeroGPU 计划正式发布—提供价值一千万美元的免费共享 GPU的更多相关文章

  1. poptest分享计划以及提供的服务

    poptest分享计划以及提供的服务 POPTEST致力于测试开发工程师的培养,能让学员经过系统培训后从事自动化测试工作,包括功能自动化.性能自动化.接口自动化以及移动端系统的自动化测试等,由于移动端 ...

  2. Google为远程入侵Titan M芯片提供最高150万美元的赏金

    Google最近发布了一项新的公告,旨在提高对发现和报告Android操作系统中的严重漏洞的漏洞赏金的奖励,Google昨天为黑客设定了新的挑战性水平,使他们可以赢得高达150万美元的赏金. 从今天开 ...

  3. 公司-ofo:ofo

    ylbtech-公司-ofo:ofo ofo小黄车是一个无桩共享单车出行平台,缔造了“无桩单车共享”模式,致力于解决城市出行问题.用户只需在微信公众号或App扫一扫车上的二维码或直接输入对应车牌号,即 ...

  4. java web 开发三剑客 -------电子书

    Internet,人们通常称为因特网,是当今世界上覆盖面最大和应用最广泛的网络.根据英语构词法,Internet是Inter + net,Inter-作为前缀在英语中表示“在一起,交互”,由此可知In ...

  5. ylbtech-公司-滴滴出行:滴滴出行

    ylbtech-公司-滴滴出行:滴滴出行 滴滴出行是涵盖出租车. 专车.  滴滴快车.  顺风车. 代驾及 大巴等多项业务在内的一站式出行平台,2015年9月9日由“滴滴打车”更名而来. 2月1日起, ...

  6. Rolf Dobelli 《清醒思考的艺术》

    为了避免输光自己靠勤奋积累的财产,罗尔夫·多贝里列了一份系统性思维错误的清单.这一份清单可以和查理·芒格的<人类误判心理学>对照查看. 自本杰明·富兰克林以来,电闪雷鸣没有减少变弱或响声变 ...

  7. [IJCAI-17 口碑商家客流量预测]

    IJCAI-17 口碑商家客流量预测               第 1 赛季截止日期        2017/03/14 赛制介绍 重要时间2月8日 08:00: 评测启动3月7日 10:00: 报 ...

  8. IBM & Howdoo – 区块链上的智能社交

    原文链接:https://www.themsphub.com/ibm-howdoo-smart-social-on-the-blockchain 我们很高兴地宣布,我们成为了一个令人兴奋的新社交网络的 ...

  9. Android 开发平台的演变史

    Android开发平台的发展(并不是很懂) Eclipse 首先是由IBM的一个项目小组花了两年时间开发完成的,当时主要解决IBM开发工具 Visual Age for Java 和 WebSpher ...

  10. 全新的软件项目,好的开始决定了成功一半!(需求&计划)

    刚看完“无问西东”,电影里说人总归还是要留下些足迹(文字)的,那么赶紧跑图书馆来留下些文字. 最近去瑞士启动了一个新的项目,那么早上做项目,晚上总结留下了一张张思维导图来记录当时的感受, 手稿如下,字 ...

随机推荐

  1. 部署javaweb项目到阿里云ecs(centos7)

    阿里云文档 https://help.aliyun.com/document_detail/51376.html?spm=5176.12901015.0.i12901015.af8f525cCPi8Q ...

  2. 一种新的姿势:程序try/catch抛出异常之绕过canary pwn121

    一种新的姿势:程序try/catch抛出异常之绕过canary 我前面发了不少关于绕过canary的姿势,先总结一下,现在绕过canary的姿势有泄露,爆破,格式化字符串绕过,多线程劫持TLS绕过, ...

  3. AI数字人直播优势凸显,那么该如何打造AI数字人直播间?

    近年来,我们听到了很多无人直播间,数字人直播间这些名词,很多人会好奇这到底是什么意思,没人还可以直播吗?那什么是AI数字人直播? AI数字人是用真人拍摄五分钟高清视频上传到青否数字人克隆端,生成的数字 ...

  4. web 报表工具如何自适应

    现在的报表用户已经不再将报表作为一个单纯的报表工具看待了,有时候也会当作页面工具来使用,这时为了页面显示工整美观,就需要报表能够自适应宽度.下面我们就基于润乾报表来讲一下是如何做到自适应展现报表. 产 ...

  5. mysql 必知必会整理—子查询与连接表[八]

    前言 简单介绍一下子查询与连接表. 正文 什么是子查询呢? 列出订购物品TNT2的所有客户. select cust_id from orders where order_num IN (SELECT ...

  6. 力扣196(MySQL)-删除重复的电子邮箱(简单)

    题目: 表: Person 编写一个 SQL 删除语句来 删除 所有重复的电子邮件,只保留一个id最小的唯一电子邮件. 以 任意顺序 返回结果表. (注意: 仅需要写删除语句,将自动对剩余结果进行查询 ...

  7. 【pytorch学习】之线性代数

    3 线性代数 3.1 标量 如果你曾经在餐厅支付餐费,那么应该已经知道一些基本的线性代数,比如在数字间相加或相乘.例如,北京的温度为52◦F(华氏度,除摄氏度外的另一种温度计量单位).严格来说,仅包含 ...

  8. EventBridge 在 SaaS 企业集成领域的探索与实践

    简介: 当下降本增效是各行各业的主题,而 SaaS 应用作为更快触达和服务业务场景的方式则被更多企业熟知和采用.本文将结合实际业务场景讲述在 SaaS 行业的洞察与 SaaS 集成的探索实践. 作者: ...

  9. 探秘RocketMQ源码——Series1:Producer视角看事务消息

    简介: 探秘RocketMQ源码--Series1:Producer视角看事务消息 1. 前言 Apache RocketMQ作为广为人知的开源消息中间件,诞生于阿里巴巴,于2016年捐赠给了Apac ...

  10. 阿里集团业务驱动的升级 —— 聊一聊Dubbo 3.0 的演进思路

    简介: 阿里云在 2020年底提出了"三位一体"理念,目标是希望将"自研技术"."开源项目"."商业产品"形成统一的技术 ...