Hugging News #0407: Google AI 的 Pix2Struct 来啦、开发者资源页面发布

HuggingFace 2024-10-21 19:50:01 原文

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」，本期 Hugging News 有哪些有趣的消息，快来看看吧！

社区活动

ControlNet 微调冲刺活动

为了帮助更好地使用 ControlNet 探索 AI 绘画，我们在全球社区联合 Google Cloud 一起举办了这次 JAX / Diffusers 社区冲刺活动。请在这里查看本次活动的详细信息。活动很快就截止报名了，再次诚挚邀请参加！

产品更新

新的 Space 应用模版: ZenML

ZenML 是一个可扩展的开源 MLOps 框架，为数据科学家、ML 工程师和 MLOps 开发者创建可移植、生产就绪的 MLOps 管道。你可以选择使用 Docker 作为 Space 应用的 SDK，并选择 ZenML 作为模版即可。

Not-For-All-Eyes 标签

我们新添加了“Not-For-All-Eyes”标签，该标签将用于标记包含可能不适合所有受众的内容的数据集等内容。你可以在个人设置里选择忽略这个标签提醒。

开源更新

‍

我们上线了一个专题页面，列举了作为软件开发者可以使用的 Hugging Face 平台的资源。

https://hf.co/spaces/huggingface/devs

Google AI 的 Pix2Struct 现已在 Transformers 中提供

Google AI 的 Pix2Struct 现已在 Transformers 中提供，Pix2Struct 是一种预先训练的图像到文本模型，用于纯视觉语言理解。该模型通过学习将网页的屏幕截图解析成简化的 HTML 来进行预训练。Pix2Struct 还引入了可变分辨率输入表示和更灵活的语言和视觉输入集成，其中语言提示（如问题）直接呈现在输入图像的顶部。该模型在四个领域的九项任务中取得了最先进的结果，包括文档、插图、用户界面和自然图像。

手把手教你使用 ControlNet

ControlNet 这个神经网络模型使得用户可以通过施加额外条件，细粒度地控制扩散模型的生成过程。这一技术最初由 Adding Conditional Control to Text-to-Image Diffusion Models 这篇论文提出，并很快地风靡了扩散模型的开源社区。来回顾我们本周的文章，学习如何使用 ControlNet！

以上就是本周大事件，祝大家有一个愉快的周末！

Hugging News #0407: Google AI 的 Pix2Struct 来啦、开发者资源页面发布的更多相关文章

Run Your Tensorflow Deep Learning Models on Google AI
People commonly tend to put much effort on hyperparameter tuning and training while using Tensoflow& ...
Google AI推出新的大规模目标检测挑战赛
来源 | Towards Data Science 整理 | 磐石就在几天前,Google AI在Kaggle上推出了一项名为Open Images Challenge的大规模目标检测竞赛.当今计算 ...
【干货分享】Google 的设计准则，素材和资源
在谷歌,他们说, “专注于用户,所有其它的就会水到渠成 ”.他们遵循设计原则,寻求建立让用户惊喜的用户体验.谷歌一直挑战自己,为他们的用户创造一种视觉语言,综合优秀设计的经典原则和创新.谷歌设计规范是 ...
【google chrome 一键打开谷歌跳转的页面+JS Replace】谷歌无法打开网页的时候，提取网页中url的部分
经常在谷歌搜索,遇到网页无法打开,然后就停留在比如:http://www.google.com.hk/search?newwindow=1&safe=strict&site=& ...
Android Market google play store帐号注册方法流程及发布应用注意事项【转载】
[转载]http://www.cnblogs.com/zdz8207/archive/2012/07/09/google-play-store-registered.html Android Mark ...
“战疫”需求不再等-京东云与AI【应急资源信息发布平台】召集开发者共同支援
截止北京时间 2020年2月5日19时00分,全国确诊新型冠状病毒肺炎24423例,疑似23260例. 新年伊始,一切都显得和往年有那么一点不一样.疫情牵动着每一个人的心脏,也有很多人早就放弃了假期投 ...
目标检测比赛---Google AI Open Images - Object Detection Track
https://www.kaggle.com/c/google-ai-open-images-object-detection-track#Evaluation Submissions are eva ...
Google、B站……那些神奇的404页面，你看过多少？
据说在第三次科技革命之前,互联网的形态就是一个大型的中央数据库,这个数据库就设置在 404 房间里面.那时候所有的请求都是由人工手动完成的,如果在数据库中没有找到请求者所需要的文件,或者由于请求者写错 ...
Android Market google play store帐号注册方法流程及发布应用注意事项
Android Market google play store帐号申请注册方法流程在 Google Play 中发布软件之前,您需要完成以下三项工作: 创建开发人员个人资料接受开发人员分发协议 ...
Serverless助力AI计算：阿里云ACK Serverless/ECI发布GPU容器实例
ACK Serverless(Serverless Kubernetes)近期基于ECI(弹性容器实例)正式推出GPU容器实例支持,让用户以serverless的方式快速运行AI计算任务,极大降低AI ...

随机推荐

homework1（1）
来自桂林理工大学物联网工程2019届的April 没参与过什么比赛项目但是课程学习能力还行,主要是快速学习之后很快就会忘记,接下来应该好好的总结并熟练记住运用知识完成对生活等各种的实践. 对课程的希望 ...
HTML第四章作业
学生实践4.1.3 1 <!doctype html> 2 <html> 3 <head> 4 <meta charset="utf-8" ...
LeetCode 之 111. 二叉树的最小深度
原题链接思路: 递归计算每个子树的深度,返回左右子树中深度小的值: 由于题目中要求的是到最近叶子节点的深度,所以需要判断左右子树为空的情况: python/python3: class Solut ...
C# 自定义控件如何正确的继承父类
C# 自定义控件可以分为三类: 复合控件:基本控件组合而成.应当继承自 UserControl 扩展控件:继承基本控件,扩展一些属性和事件.比如继承 Button 自定义控件:直接继承自 Contro ...
python+appium拉起APP
1.首先需要完成环境配置: JDK:https://www.cnblogs.com/wenlongma/p/17103062.html: SDK:https://www.cnblogs.com/w ...
Java反射机制知识
modifier:修饰语名词 JAVA 反射机制中,Field的getModifiers()方法返回int类型值表示该字段的修饰符. 其中,该修饰符是java.lang.reflect.Modifi ...
linux java 环境搭建
java -version 是否安装 yum -y remove java-1.7.0-openjdk* yum -y install java-1.7.0-openjdk* vim /etc/pro ...
使用vCenter对ESXi主机进行补丁升级
使用vCenter 对ESXi 主机进行补丁升级背景说明:公司内部有许多ESXi主机需要进行补丁升级,记录一下通过vCenter对ESXi主机进行补丁升级的过程,也可以使用esxcli命令行方式: ...
vulhub的搭建
官网简介:Vulhub是一个基于docker和docker-compose的漏洞环境集合,进入对应目录并执行一条语句即可启动一个全新的漏洞环境,让漏洞复现变得更加简单,让安全研究者更加专注于漏洞原理本 ...
ABAP 调用HTTP上传附件（二）之中文乱码
1.这篇文章的由来之前已经发表了<ABAP 调用HTTP上传附件>的文章,详细介绍了如何通过HTTP请求传输附件,可点击链接参考原有文档因为之前对传输文件的中文文件名处理上解释不够详细 ...