每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧!

重磅更新

庆祝 Hugging Face 模型中心上的一百万个代码仓库!

最近 Hugging Face 又取得一个重要里程碑,我们的模型中心(Hub)上已经拥有一百万个代码仓库了!

自2023 年 1 月 3 日起我们的模型增长情况:

  • 模型:22 万 -> 51 万
  • 数据集:5 万 -> 23 万
  • Spaces(空间):3.9 万 -> 22 万

这一切都归功于开源的力量!

Accelerate 加速库下载量过 3000 万!

在短短的两个月内,我们的 Hugging Face Accelerate 加速库下载量从 2000 万增长到了 3000 万!看到 PyTorch 生态系统内的增长和使用情况非常令人惊叹,我们对未来的发展充满期待!

Accelerate 加速库是一个能够通过仅添加四行代码在任何分布式配置下运行相同 PyTorch 代码的库!它使得规模化进行训练和推断变得简单、高效且灵活。

Accelerate 加速库基于 torch_xla 和 torch.distributed 构建,负责处理繁重的工作,因此你无需编写任何自定义代码来适应这些平台。将现有代码库转换为使用 DeepSpeed,执行完全分片的数据并行操作,并自动支持混合精度训练!如果想要了解更多关于 Accelerate 加速库的信息,请访问项目:

GitHub:https://github.com/huggingface/accelerate

文档:https://huggingface.co/docs/accelerate/index

与 MLCommons 合作推出 MedPerf

Hugging Face 非常高兴能够与 MLCommons 合作,共同推出一个使用联合评估的医疗基准测试框架 MedPerf

这个开放的科学倡议已在 NatMachIntell (自然-机器智能杂志)上发表,这是在严格和隐私保护的医疗 AI 模型评估迈出的重要一步。我们相信医疗 AI 领域需要更多的开放科学努力,因此我们很开心能够与20多个学术机构、9家医院和20多家公司一起为这一努力作出贡献。

论文链接:https://nature.com/articles/s42256-023-00652-2

网站链接:https://medperf.org

开源更新

Hugging Face 物体检测排行榜

非常高兴与大家分享我们的最新创作:物体检测排行榜

开放式目标检测排行榜旨在跟踪、排名和评估存储在 Hub 中的视觉模型,这些模型旨在在图像中检测对象。社区中的任何人都可以请求对一个模型进行评估并将其添加到排行榜中。查看 指标选项卡可以了解如何评估这些模型。

如果你想要没有列在此处的模型的结果,可以通过邮件 ️向我们提出对其结果的请求。如果你有一个模型,也欢迎带过来看看它的表现如何!

快去看看吧:http://huggingface.co/spaces/rafaelpadilla/object_detection_leaderboard

推出 Agent.js

我们最近推出了 Agents.js,这是 huggingface.js 库的一个新内容,可以让你通过工具为你的 LLM 提供动力,仅使用 JavaScript 就能实现,可以让你从 JavaScript 中在浏览器或服务器上为 LLM 提供工具访问! 它配备了多模态工具,可以从 Hub 调用推理端点,并且可以轻松地通过你自己的工具和语言模型进行扩展。

在这里阅读更多信息:https://huggingface.co/blog/agents-js

用 2 行代码将 Bark 的文本转语音加速 30%

想要加速你的文本转语音生成吗?感谢 Hugging Face 的 Optimum 和半精度,现在你只需两行代码就可以让 Bark 的生成速度提升近 30%!

在这里测试每种优化:https://colab.research.google.com/drive/1XO0RhINg4ZZCdJJmPeJ9lOQs98skJ8h_?usp=sharing

如果你的内存受限,你可以通过只增加一行额外的代码来减少 GPU 的内存占用,将其降低 60% ,采用 CPU 卸载!你也可以使用批处理获得免费的吞吐量,将批处理设置为 8 并使用 fp16,你可以获得 6 倍的吞吐量,而仅减慢 1.3 倍的速度!

Bark 是由 Suno AI 在 suno-ai/bark 中提出的基于 transformer 的文本转语音模型。

Bark 由 4 个主要模型组成:

  • BarkSemanticModel(也称为“文本”模型):一种因果自回归 transformer 模型。
  • BarkCoarseModel(也称为“粗声学”模型):一种因果自回归 transformer,它以 BarkSemanticModel 模型的结果作为输入。它的目标是预测 EnCodec 所需的前两个音频码书。
  • BarkFineModel(“细声学”模型),这次是一种非因果自编码 transformer,它基于先前码书嵌入的总和,迭代地预测最后的码书。
  • 在预测了 EncodecModel 的所有码书通道后,Bark 使用它来解码输出音频数组。

HF Optimum 是 Hugging Face 开发的一个优化库,旨在提高深度学习模型训练的效率和性能。它自动地为模型选择合适的超参数,如学习率、批大小等,以最大程度地提高训练速度和模型性能。HF Optimum 利用了自动调参技术,通过多次试验不同的超参数组合,找到最优的组合,从而减少了用户手动调参的工作量。

半精度(Half Precision)是一种深度学习训练中的数值表示方式,使用较少的位数来表示模型参数和梯度。传统的单精度浮点数使用 32 位表示,而 half precision 使用 16 位表示。虽然使用较少的位数会导致数值范围的缩小和精度的降低,但它能够显著减少模型计算的时间和内存需求,从而加快训练速度。许多现代的深度学习库和硬件加速器都支持 half precision 训练,使得在性能和资源之间取得了平衡。

本期内容编辑: Shawn


以上就是本期的 Hugging News,新的一周开始了,我们一起加油!

Hugging News #0821: 新的里程碑:一百万个代码仓库!的更多相关文章

  1. C#6新特性,让你的代码更干净

    前言 前几天看一个朋友的博客时,看他用到了C#6的特性,而6出来这么长时间还没有正儿八经看过它,今儿专门看了下新特性,说白了也不过是语法糖而已.但是用起来确实能让你的代码更加干净些.Let's try ...

  2. 如何添加商*通新对话快捷链接?不用js代码

    我们在使用商务通一般都是在页面中嵌入一段js代码,如果您是js洁癖,是不是在想着如何直接用一张小图加上商*通新对话链接来代替呢?好,那就一起来研究一下吧. 首先,我们打开一个有商*通js弹窗的页面,比 ...

  3. 转:【Java并发编程】之二十三:并发新特性—信号量Semaphore(含代码)

    载请注明出处:http://blog.csdn.net/ns_code/article/details/17524153 在操作系统中,信号量是个很重要的概念,它在控制进程间的协作方面有着非常重要的作 ...

  4. (转)Visual Studio 2013新功能预览:增代码的透明度和可追溯性

    微软打破了Visual Studio两年升级一次的传统,Visual Studio 2012发布还不足一年,微软就计划发布了Visual Studio 2013了.在今天的TechEd大会上,微软宣布 ...

  5. 新手教程: 如何在新浪云计算SAE里部署代码

    感谢 sou6 的投递 时间:2011-11-22 来源:老夏博客 SAE自2011-7-10日起,全面支持SVN代码部署,用户不仅可以通过任何SVN客户端部署代码,而且SAE现有的代码部署方式也已经 ...

  6. git本地创建新分支并推送到远程仓库

    1,在当前项目目录,从已有的分支创建新的分支(如从master分支),创建一个dev分支 git checkout -b dev 2,创建完可以查看一下,分支已经切换到dev git branch * ...

  7. 新西达电调初始化代码,使用nodejs ffi技术调用wiringpi,代码使用typescript编写

    这是我设计的F450四轴飞行器飞控代码的一部分 运行在orangepi-zero上,操作系统是armbian,思路是使用node-ffi调用wiringpi的so库与GPIO通信,然后控制端逻辑代码使 ...

  8. Qt项目ui文件中新添加的控件在代码中不识别的问题解决

    今天在学Qt框架的信号槽,然后发现在ui中加的控件,通过ui-> 找不到,没有识别,于是上网查找了一下问题 解决方法 添加ui控件后,执行程序,退出程序,将debug目录下的ui_XXXX.h拷 ...

  9. ComboBox,三级联动菜单,新入门点小白,有些代码有待优化,大神勿喷

    //当前窗体的Load事件 private void provinceANDCity_Load(object sender, EventArgs e) { //连接字符串 string strConn ...

  10. 2017萌新的ACM之旅参考代码

    地址:https://vjudge.net/contest/180794#overview A #include <iostream> using namespace std; int m ...

随机推荐

  1. Selenium - 元素定位(3) - CSS进阶

    Selenium - 元素定位 CSS 定位进阶 元素示例 属性定位 # css 通过id属性定位 driver.find_element_by_css_selector("#kw" ...

  2. annotate()使用聚合计数、求和、平均数 raw()执行原生的SQL

    annotate()使用聚合计数.求和.平均数  raw()执行原生的SQL # 按老师分组,求课程的销量 Course.objects.values('Teacher').annotate(vol= ...

  3. 【GiraKoo】面向对象开发系列之【为什么要用面向对象】

    开源项目:https://girakoo.com/ 问答 为什么要有面向对象开发? 面向过程开发的C语言,往往有以下几个问题: 不同的开发人员需要使用功能完全相同,或者大部分相同的函数.如果某个算法存 ...

  4. 补充:C语言枚举类型

    1.枚举类型 1.枚举数据类型是C语言中一种构造数据类型,可以让数据更加简洁,更易读,对于只有几个特定的数据,可以使用枚举类型 2.枚举对应英文enumeration,简写为enum 3.枚举是一组常 ...

  5. 计算机网络 传输层协议TCP和UDP

    目录 一.传输层协议 二.tcp协议介绍 三.tcp报文格式 四.tcp三次握手 五.tcp四次挥手 六.udp协议介绍 七.常见协议和端口 八.有限状态机 一.传输层协议 传输层协议主要是TCP和U ...

  6. weexplus真机调试

    一.连接真机 C:\Users\Lenovo>adb devices List of devices attached C9K7N15722004375 device 确定连接无误,否则执行we ...

  7. javaer你还在手写分表分库?来看看这个框架怎么做的 干货满满

    java orm框架easy-query分库分表之分表 高并发三驾马车:分库分表.MQ.缓存.今天给大家带来的就是分库分表的干货解决方案,哪怕你不用我的框架也可以从中听到不一样的结局方案和实现. 一款 ...

  8. C#/VB.NET:如何从 PowerPoint 演示文稿中提取文本

    在学习或者日常工作中,有时我们需要把幻灯片的东西整理成文字,而从 PowerPoint 演示文稿中一张一张的整理手动复制粘贴,整个过程会非常费精力且耗时.那么怎么样才能比较轻松且快速地提取PowerP ...

  9. 如何科学地利用MTTR优化软件交付流程?

    谷歌提出的衡量 DevOps 质量的 DORA 指标让 MTTR(平均恢复时间) 名声大振.在本文中,你将了解到 MTTR 的作用.为什么它对行业研究很有用.你可能被它误导的原因以及如何避免 MTTR ...

  10. JS异步解决方案及优缺点

    1. 回调函数 优点: 解决了同步的问题(只要有一个任务耗时长后面的任务都会等待,会拖延程序执行) 缺点: 回调地狱  不能用try  catch捕获  不能用 return setTimeout(( ...