每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。

产品更新

Space 应用支持使用模版了

只需点击几下,即可轻松构建、部署和共享你最喜爱的开源项目,Hugging Face Spaces 已经支持使用 Docker 构建,现在它又增加了模版的支持。

我们的第一个 Space 模版是和 Argilla 合作完成,你可以在 Space SDK 中选择 Docker,然后就可以选择 Argilla 模版了。

Argilla 是一个开源的、以数据为中心的 NLP 平台,可以用于数据标注、机器学习运维和反馈循环,刚刚获得一轮 160 万美元的投资,查看 Argilla 官网了解更多: https://www.argilla.io/

Hub 上的搜索功能更强了

{{插入视频}}

本月初上线的 Hugging Face Hub 的全文搜索功能现已支持实时反馈查询结果、暗色模式以及可分享的搜索链接等,帮助用户更快速在 Hub 上找到所需要的内容,仅上线一周,就有超过 7.5 万次搜索!快来试试看吧: https://hf.co/search

一个新的 GitHub Action 发布,将你的代码仓库同步到 Hub

那废话,不多说;那同步,来一波! https://github.com/marketplace/actions/sync-with-hugging-face-hub

Hub 分类新增图机器学习

如果你对图机器学习还不熟悉的话,我们之前发过一篇关于 图机器学习相关的文章 可以了解一下,Hub 的分类新增了图机器学习的分类,可以去看看相关的数据集和模型找找灵感啦 https://bit.ly/HFGraphML

开源库更新

PEFT 开源!低成本高效微调模型不是梦

PEFT (Parameter-Efficient Fine-Tuning) 是 Hugging Face 开发的一个库,旨在用更少的可训练参数对大型语言模型进行微调,从而显着节省成本和时间。关于 PEFT,我们也有一篇博客介绍,会在之后的微信推文中发布。

Transformers 增加了第一个文本转语音模型

SpeechT5 是我们添加到 Transformers 的第一个文本转语音模型,我们计划在不久的将来添加更多的 TTS 模型。

「看图说话」模型合集

在这个 Space 应用中,Hugging Face 的机器学习工程师 Niels 向大家对比了几种不同的图生文模型: GIT、BLIP、CoCa 和 BLIP-2,你可以上传一个图片来查看每个模型根据图片生成的图片文字描述结果,小编用了一个红包封面图片让几个模型说说看是啥内容,你觉得哪个更准呢?

在 Diffusers 库中使用 Latent Upscaler 生成更高分辨率的图片

Stable Diffusion Latent Upscaler 模型由 Katherine Crowson 与 Stability AI 合作构建。它可以在任何 StableDiffusionUpscalePipeline checkpoint 之上使用,以将其输出图像分辨率提高 2 倍。

查看模型卡片: https://hf.co/stabilityai/sd-x2-latent-upscaler

查看文档: https://hf.co/docs/diffusers/api/pipelines/stable_diffusion/latent_upscale

查看 Space 应用: https://hf.co/spaces/huggingface-projects/stable-diffusion-latent-upscaler

你可以在 Transformers 中使用 BLIP-2 啦!

上周我们介绍了一个能够教会 ChatGPT 看图的、由 Salesforce Research 开源的大语言模型 BLIP-2,大家开源在上面的聊天截图里看看它的强大之处。

现在你已经可以在 Transformers 中使用它了,详见文档: https://hf.co/docs/transformers/main/en/model_doc/blip-2

没有试过的朋友们,可以在 Space 应用中试试看: https://hf.co/spaces/Salesforce/BLIP2

学习资源 & 内容更新

LAION.ai 团队制作了一个 CoCa (Contrastive Captioners) 的 Space 应用,快来试试看: https://hf.co/spaces/laion/CoCa

本月初微软发布的 BioGPT-Large 已经发布到 Hugging Face Hub 上啦,欢迎使用: https://hf.co/microsoft/BioGPT-Large

在生成文本时,大语言模型会输出每个词在其生成的文本序列中出现的概率分布,这些概率分布反映了模型在生成每个词时的置信度。如果它在「一本正经的胡说八道」,那么它生成的文本中每个词的概率分布可能与正确答案的概率分布有较大的差异。

你可以用这个 Space 应用通过为语言模型的输出文字进行着色,例如,对于某个给定的单词,如果其概率很低,那么可以使用红色高亮显示该单词。这样,用户可以更加直观地了解模型输出的每个单词的置信度和概率分布,从而更好地识别可能存在的错误。 https://hf.co/spaces/joaogante/color-coded-text-generation


以上就是上周的 Hugging News!

Hugging Face 每周速递: Space 支持创建模版应用、Hub 搜索功能增强、BioGPT-Large 还有更多的更多相关文章

  1. Hugging Face 每周速递:Spaces 上边可以跑 Jupyter Notebook;百度 UIE-X 模型展示发布...

    每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新.社区活动.学习资源和内容更新.开源库和模型更新等,我们将其称之为「Hugging Ne ...

  2. Visual Studio 2015速递(3)——ASP.NET 新特性

    系列文章 Visual Studio 2015速递(1)——C#6.0新特性怎么用 Visual Studio 2015速递(2)——提升效率和质量(VS2015核心竞争力) Visual Studi ...

  3. Visual Studio 2015 速递(4)——高级特性之移动开发

    系列文章 Visual Studio 2015速递(1)——C#6.0新特性怎么用 Visual Studio 2015速递(2)——提升效率和质量(VS2015核心竞争力) Visual Studi ...

  4. Visual Studio 2015速递(2)——提升效率和质量(VS2015核心竞争力)

    系列文章 Visual Studio 2015速递(1)——C#6.0新特性怎么用 Visual Studio 2015速递(2)——提升效率和质量(VS2015核心竞争力) Visual Studi ...

  5. Visual Studio 2015速递(1)——C#6.0新特性怎么用

    系列文章 Visual Studio 2015速递(1)——C#6.0新特性怎么用 Visual Studio 2015速递(2)——提升效率和质量(VS2015核心竞争力) Visual Studi ...

  6. Visual Studio 2015速递(4)——高级特性之移动开发

    系列文章 Visual Studio 2015速递(1)——C#6.0新特性怎么用 Visual Studio 2015速递(2)——提升效率和质量(VS2015核心竞争力) Visual Studi ...

  7. 外媒速递:系统管理员必须掌握的20条Linux命令

    [51CTO.com原创稿件]外媒速递是核子可乐精选的近日国外媒体的精彩文章推荐,希望大家喜欢! 今天推荐的内容包括:系统管理员必须掌握的20条Linux命令.五款最佳Linux屏幕记录应用.MySQ ...

  8. 一年一度!GitHub 开发者大会「GitHub 热点速递 v.22.45」

    GitHub 是全球最大的开源社区,它的一举一动都深受每一位开源爱好者的关注.这周末刚落下帷幕的<GitHub Universe 2022>是 GitHub 发布最新产品.功能.报告和计划 ...

  9. 外媒速递:十大最佳心理学概念助你提升Web设计效果

    外媒速递是核子可乐精选的近日国外媒体的精彩文章推荐,希望大家喜欢! 本期给大家推荐的是帮助你提升Web设计效果的十大最佳心理学概念.改善企业云环境协作效率的九款卓越工具.选择移动应用开发工具时要考虑的 ...

  10. Python爬虫之豆瓣-新书速递-图书解析

    1- 问题描述 抓取豆瓣“新书速递”[1]页面下图书信息(包括书名,作者,简介,url),将结果重定向到txt文本文件下. 2- 思路分析[2] Step1 读取HTML Step2 Xpath遍历元 ...

随机推荐

  1. SourceGenerator 使用姿势(1):生成代理类,实现简单的AOP

    SourceGenerator 已经出来很久了,也一直在关注.之前观摩大佬 xljiulang 的 WebApiClient 使用 SourceGenerator 生成接口代理类,深受启发,准备拿过来 ...

  2. ATM购物车项目总结

    目录 项目实现思路 ATM项目 优先实现功能 拆分函数 项目路径展示 项目启动文件 start.py 配置文件 setting.py 日志配置字典 日志函数 展示层 src.py 用户注册 获取用户输 ...

  3. 伙伴福利,100个项目彻底精通Java!【开源】

    为了帮助更多的小伙伴,快速成长进步,冲进大厂中厂,我分享了很多的项目哟,例如: java项目精品实战案例 | JavaSwing实战项目 但很多小伙伴,还觉得不够,好吧!今天就拿出压箱底的项目,给支持 ...

  4. 图解B树及C#实现(2)数据的读取及遍历

    目录 前言 查询数据 算法说明 代码实现 查询最值 算法说明 代码实现 B树的遍历 算法说明 代码实现 Benchmarks 总结 参考资料 前言 本文为系列文章 B树的定义及数据的插入 数据的读取及 ...

  5. 浅谈 C++ 模板 & 泛化 (妈妈再也不用担心我不会用 std::sort 了)

    基础复习 先上个对 int 类型数组的插入排序: void insertionSort_01(int* seq, int firstIndex, int lastIndex) { for (int j ...

  6. [sklearn] 决策树、随机森林、隐马尔可夫模型

    决策树 决策树(Decision Tree)是一种用于处理分类和回归问题的无监督学习算法.如下图所示为某女青年在某相亲网站的相亲决策图.这幅图描述的都是一个非常典型的决策树模型. 通过对其相亲决策的分 ...

  7. 使用Python库pyqt5制作TXT阅读器(一)-------UI设计

    项目地址:https://github.com/pikeduo/TXTReader PyQt5中文手册:https://maicss.gitbook.io/pyqt-chinese-tutoral/p ...

  8. Codeforces Gym 104059B - Breeding Bugs

    简要题意 Virtual Judge 传送门 | Codeforces Gym 传送门 给出一个长度为 \(n\) 的序列 \(a\),你需要从中选出一些数,使其两两相加不为质数.输出最大可以选择多少 ...

  9. React中实现keepalive组件缓存效果

    背景:由于react官方并没有提供缓存组件相关的api(类似vue中的keepalive),在某些场景,会使得页面交互性变的很差,比如在有搜索条件的表格页面,点击某一条数据跳转到详情页面,再返回表格页 ...

  10. uniapp如何打包wgt格式

    打包 build 首次打包,需要配置AppId 登录dcloud开发者中心 点击直达 创建应用 将生成的AppId配置到项目manifest.json中 开始打包 打包成功