每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!

产品更新

Paper Pages 大更新

我们正在继续加深与预印本平台 (arXiv.org) 的合作和集成,除了可以在论文页面直接找到 Hugging Face 上的 Space 应用以外,我们又为 Hugging Face Hub 上线了一个论文页面,比如: https://hf.co/papers/2211.05100

你还可以通过论文编号查询模型、数据集和 Space 应用,也可以在模型和数据集页面直接访问到论文页面:

与此同时,如果你是某个论文的作者之一,你还可以在 Hugging Face 的论文页面来“认领”和关联你的 Hugging Face 账号。

用户的个人页面也会显示自己的论文:

快来试试看吧!

Docker ️ HuggingFace

你可以在 Spaces 中使用 Docker SDK 来构建你的机器学习应用。上一周,我们还发布了一项与 Docker 的合作,现在你可以将你的 Space 应用一键使用 Docker 部署到其他环境中啦!

Hub 对 ipynb 文件 (Jupyter Notebook) 的两个重要更新

Hub 的页面现在可以直接渲染 .ipynb 文件 (Jupyter Notebook) 啦 ,除此之外,我们还与 Google Colab 团队合作,现在 Colab 可以直接打开托管在 Hugging Face Hub 上的 .ipynb 文件啦:

Zapier 平台加入对 Hugging Face 的集成支持

Zapier 是一个自动化工作平台,而无需编写任何代码即可快速自动化很多业务流程。通过与Hugging Face 的集成,你可以使用将任意其他工作流程与 Hugging Face 提供的 AI 模型能力结合。快来试试看吧:

https://zapier.com/apps/hugging-face/integrations

社区活动

Gradio 创意主题构建大赛

Gradio 团队发起了一个主题构建黑客松活动,快来参与吧!本次和黑客松活动为期两周,你可以发挥创意和脑洞任意构建有意思的 Gradio 主题。下面有一个视频来简单介绍如何上手制作一个主题:

https://www.bilibili.com/video/BV1Xv4y1H7it/

如果你想参与,请在这个页面查看参与方法:

https://hf.co/Gradio-Themes

也可以在这个 Space 应用里查看别人做的主题:

https://hf.co/spaces/gradio/theme-gallery

开源库更新

bloomz.cpp 让你在 Mac 和手机上运行 BLOOM 模型

bloomz.cpp 是一个用纯 C/C++ 实现 Hugging Face 的 BLOOM 系列模型推理的代码库。它建立在 @ggerganov 的 llama.cpp 库之上,支持使用 BloomForCausalLM.from_pretrained() 加载的所有模型。库还支持高级用法,可以进行更详细的设置和自定义操作。

GitHub 地址: https://github.com/NouamaneTazi/bloomz.cpp

The Stack 数据集 v1.2 正式版发布

The Stack 是 BigCode 项目的一部分,这是一个包含了 300 种编程语言的开源代码数据集。

数据集页面: https://hf.co/datasets/bigcode/the-stack

Common Voice 13 数据集现已「登陆」 Hugging Face

Common Voice 的多语言数据集是最大的公开语音数据集,Mozilla 相信,一组大型、可公开使用的语音数据集,将可促进基于机器学习的语音技术的创新,与健康的商业竞争。目前,Common Voice 13 数据集已经在 Hugging Face Hub 上发布,借助 Datasets 库,你只需要几行代码就可以使用它。

数据集页面: https://hf.co/datasets/mozilla-foundation/common_voice_13_0

TRL v0.4.1 发布

TRL (Transformer Reinforcement Learning) 是一个用于训练具有增强学习的 Transformer 语言模型的库,可与transformers 集成。它支持使用 Proximal Policy Optimization(PPO)优化解码器模型,例如 GPT-2、BLOOM、GPT-Neo。

0.4.1 版本更新包括支持大型模型训练、简易 pipeline 并行、peft 数据并行支持,以及分布式训练的错误修复。简易管道并行支持大规模模型在训练设置中进行拟合,以便在这些模型上应用 RLHF。此功能使用 peft 训练适配器,同时利用 bitsandbytes 来减少活动模型的内存占用。通过修复与 peft 集成和 DP 相关的错误,支持多 GPU 训练。此外,对于 PyTorch 2.0 的发布,本次更新还包括一些小的修复。

GitHub 地址: https://github.com/lvwerra/trl


祝大家有一个愉快的周末,我们下周见!

Hugging News #0331: Hugging Papers 来啦,快来认领你的论文!的更多相关文章

  1. NLP与深度学习(六)BERT模型的使用

    1. 预训练的BERT模型 从头开始训练一个BERT模型是一个成本非常高的工作,所以现在一般是直接去下载已经预训练好的BERT模型.结合迁移学习,实现所要完成的NLP任务.谷歌在github上已经开放 ...

  2. 2022了你还不会『低代码』?数据科学也能玩转Low-Code啦! ⛵

    作者:韩信子@ShowMeAI 数据分析实战系列:http://www.showmeai.tech/tutorials/40 机器学习实战系列:http://www.showmeai.tech/tut ...

  3. PayPal高级工程总监:读完这100篇论文 就能成大数据高手(附论文下载)

    100 open source Big Data architecture papers for data professionals. 读完这100篇论文 就能成大数据高手 作者 白宁超 2016年 ...

  4. 【翻译】Neural Collaborative Filtering--神经协同过滤

    [说明] 本文翻译自新加坡国立大学何向南博士 et al.发布在<World Wide Web>(2017)上的一篇论文<Neural Collaborative Filtering ...

  5. 检索式chatbot:

    小夕从7月份开始收到第一场面试邀请,到9月初基本结束了校招(面够了面够了T_T),深深的意识到今年的对话系统/chatbot方向是真的超级火呀.从微软主打情感计算的小冰,到百度主打智能家庭(与车联网? ...

  6. spark 笔记 2: Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing

    http://www.cs.berkeley.edu/~matei/papers/2012/nsdi_spark.pdf  ucb关于spark的论文,对spark中核心组件RDD最原始.本质的理解, ...

  7. [poj1679]The Unique MST(最小生成树)

    The Unique MST Time Limit: 1000MS   Memory Limit: 10000K Total Submissions: 28207   Accepted: 10073 ...

  8. APS期刊投稿准备: REVTex格式

    APS是American Physics Society的简称.旗下比较有影响力的期刊有: "pra, prb, prc, prd, pre, prl, prstab, prstper, o ...

  9. Spark技术内幕:究竟什么是RDD

    RDD是Spark最基本,也是最根本的数据抽象.http://www.cs.berkeley.edu/~matei/papers/2012/nsdi_spark.pdf 是关于RDD的论文.如果觉得英 ...

  10. L1-Day13

    1.Being late is an unforgivable sin here.[我的翻译]在北京,迟到是不可饶恕的罪名.[标准答案]在这里迟到是不可原谅的.[对比分析]对自己的也是醉醉的了,Bei ...

随机推荐

  1. Vue中nextTick的时序问题

    前言 Vue.$nextTick这个API相信很多人都用过,按照文档的解释,"在下次DOM更新循环结束之后执行延迟回调.在修改数据之后立即使用这个方法,获取更新后的DOM".我们通 ...

  2. Liunx安装Docker

    1.更新yum包到最新 sudo yum update 2.卸载历史Docker,如果没有安装过,则跳过该步 sudo yum remove docker \ docker-client \ dock ...

  3. Jmeter一、开源软件的崛起

    一.jmeter自身特点: 1.开源,轻量级,更适合自动化和持续集成. 2.学习难度大. 3.资料少.多英文. 二.性能测试工具选型的原则 1.成本: a.工具成本 b.学习成本 2.通信协议: a. ...

  4. UE4 联网RPC部分

    有些人生来就是为了奔跑,而有些人,则拥有更高的目标> 笔者近期在进行UE C++网络的一些开发,发现RPC这个部分它看起来很简单,理解起来也算不上难.但真正应用起来,对netcode经验不多的人 ...

  5. asm 理解

    stm32中有3条总线:地址总线,数据总线,系统总线:地址总线上是地址值,数据总线上是数据值,cpu读写时会先在地址总线上传输地址值,如果是写操作之后数据总线上会放往前面地址处写入的数据值,如果是读操 ...

  6. 第8章 使用标记帮助工具构建表单(ASP.NET Core in Action, 2nd Edition)

    本章包括 使用Tag Helpers轻松构建表单 使用锚标记帮助程序生成URL 使用Tag Helpers为Razor添加功能 在第7章中,您了解了Razor模板以及如何使用它们为应用程序生成视图.通 ...

  7. 使用TLS/SSL传输层安全机制实现web项目的通信安全

    自己的web项目在内网ip访问时,浏览器会提示不安全 原因就是因为没有证书,而传输层的TLS/SSL协议,会告诉我们本地客户端的浏览器,我现在访问的web项目的ip地址可能存在安全风险 要解决这个通信 ...

  8. uni-app 小程序在iOS系统无法长按复制问题

    最近在使用uni-app开发移动端应用,有客户反映微信小程序版本在使用是无法长按复制问题,在安卓系统上却是正常的. 检查了下代码,对text标签都设置了selectable属性,寻找万能的度娘还是没有 ...

  9. Maven-高级

    Mvaen 高级 1 导入其他工程 资源文件 先install到仓库里 然后根据组织名项目名版本号写在dependence里正常导入 <dependence> <groupId> ...

  10. vue中的普通函数与箭头函数以及this关键字

    普通函数 普通函数指的是用function定义的函数 var hello = function () { console.log("Hello, Fundebug!"); } 箭头 ...