每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧!

重磅更新

Hugging Face 开源大模型排行榜发现异常:让我们来调查一下!

Open LLM 排行榜是 Hugging Face 设立的一个用于评测开放大语言模型的公开榜单。最近,随着 Falcon 的发布并在 Open LLM 排行榜上疯狂屠榜,围绕这个榜单在推特上掀起了一轮热烈的讨论。

讨论主要围绕排行榜上的四个评测基准其中之一: 大规模多任务语言理解(Massive Multitask Language Understanding,MMLU)基准。

社区发现头部模型 LLaMA 在 Open LLM 榜单上的 MMLU 得分比 LLaMA 论文 中宣称的数字要低很多,大家都感觉很奇怪。

因此,我们决定深入分析一下这个现象,看看到底是什么原因,又应该如何解决。

在这段旅程中,你将学到很多有关如何评测模型的知识,因此,如果后面你在网络上或论文中看到了相关的评测数字,相信你就会有一定的判断力了。

详细内容请看我们在 Hugging Face 公众号发布的文章:Open LLM 排行榜近况

Hugging Face 开源大模型榜单更新啦

  • 更新之一:使用更新版 Harness 重新刷榜,更新得分

在 Falcon 大模型发布之后,很多人对我们开源大模型榜单上的 LLaMA 排名下降及评分进行讨论在 Harness 版本更新之后,我们对所有大模型重新刷榜,目前的得分结果都是最新的!

  • 更新之二:更快速的推理

我们现在对兼容模型使用 text - generation - inference 文本生成推理,它速度极快且无缝连接,直接让后端的速度提升了一个数量级 。对于其他模型,我们使用超级棒的 accelerate 来优化并行性。

  • 更新之三:提高了可复制性

可以在更多的位置找到你想要的信息以便复制或重现 比如在 "about" 可以找到更多的指令细节;在扩展 view 里可以看到更多有关模型的信息;一如既往,所有刷榜的结果和数据也都开源在我们的 Hub 上

如果我们在 Hugging Face 做一个中文大模型的列表并随时更新,你觉得怎么样?️

欢迎留言告诉我们你的想法和问题

社区活动

AI 头像变装秀获得邀请你参加!

我们在小红书平台上举办的「AI 头像变装秀」活动时间已经过半,我们看到大家生成了很多很多可爱的、抖包袱的、唯美的 AI 头像,只能说大家都太优秀啦!越发觉得好像没有一个 AI 生成的头像,出门都不好意思跟人打招呼啦!

7 月 5 日至 7 月 31 日举行 Hugging Face AI 头像变装秀活动

活动介绍: 我们将分享一段 Stable Diffusion 的 Notebook 代码 ️ (https://hf.link/tx)(不要听到代码就头疼呀集美们,超简单的!)顺着执行这段 Notebook 代码,你将可以使用 AI 生成自己的头像,生成头像的风格不限

参与方式: 在使用我们提供的代码生成头像之后,请在你的小红书发布一篇笔记 分享你的成果或体验,并 @Hugging Face 官方账号让我们知道。

活动时间: 活动将在 7 月 31 日 (周一) 晚上 12 点截止,届时获赞最多的 前三名 小伙伴将获得神秘小惊喜

如果有疑问 请随时私信或留言!可到小红书查看活动详情,官方小红书账号活动链接:

https://hf.link/imot4

内容更新

音频 Transformers 课程完成发布!

我们发布了完全开源的音频 Transformers 课程,迄今为止反响非常好!

Transformers 作为一种强大而多功能的深度学习架构,一次又一次地证明了自己在各种任务中的卓越表现,包括自然语言处理、计算机视觉,最近更是在音频处理领域也有不凡的表现。

在这门课程中,我们将探索如何将 Transformers 应用于音频数据。你将学习如何使用它们来处理各种音频相关的任务。无论你对语音识别、音频分类还是从文本生成语音感兴趣,Transformers 和本课程都能满足你的需求。

课程链接 :https://hf.co/learn/audio-course/chapter0/introduction

我们已经完成了 7 个单元的发布:

  • 单元 1:处理音频数据 - 为处理音频奠定基础。
  • 单元 2:音频应用简介 - 介绍了众多音频应用。‍♂️
  • 单元 3:音频的 Transformers 架构 - 讲解了处理音频相关任务时存在的不同类型的架构和设计!️
  • 单元 4:构建音乐流派分类器 - 实际操作教程,教你如何构建音频分类流程。
  • 单元 5:语音识别 - 深入探索语音识别,并构建一个模型来转录会议记录
  • 单元 6:文字转语音 - 学习如何将给定的文本转换为音频输出
  • 单元 7:具体应用 - 构建真实世界的音频应用程序

完成这门课以后,你将获得使用 Transformers 处理音频数据的坚实基础,并且能够将这些技术应用到各类音频相关的任务上。

为了这次课程,我们还进行了两次线上活动,目前两次活动的回放已经发布,请通过我们的官方哔哩哔哩账号查看: https://hf.link/bili

本期内容编辑: Shawn


以上就是本期的 Hugging News,新的一周开始了,我们一起加油!

Hugging News #0717: 开源大模型榜单更新、音频 Transformers 课程完成发布!的更多相关文章

  1. 千亿参数开源大模型 BLOOM 背后的技术

    假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,"一朝看尽长安花"似乎近在眼前 -- 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM ...

  2. 华为高级研究员谢凌曦:下一代AI将走向何方?盘古大模型探路之旅

    摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦.谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的"前世今生",以及它背后的艰难 ...

  3. 【转】使用Apache Kylin搭建企业级开源大数据分析平台

    http://www.thebigdata.cn/JieJueFangAn/30143.html 本篇文章整理自史少锋4月23日在『1024大数据技术峰会』上的分享实录:使用Apache Kylin搭 ...

  4. 2017中国人工智能公司榜单发布,颠覆AT的AI独角兽全在这

    每年12月,创业邦研究中心评选并报道“中国创新成长企业100强”,这个榜单我们已经连续做了8年,是中国最有潜力的创业新贵榜,受到了业内广泛认可.从2015年开始我们发现,人工智能上榜企业明显增多,20 ...

  5. 使用Apache Kylin搭建企业级开源大数据分析平台

    转:http://www.thebigdata.cn/JieJueFangAn/30143.html 我先做一个简单介绍我叫史少锋,我曾经在IBM.eBay做过大数据.云架构的开发,现在是Kylige ...

  6. MariaDB强势席卷DB-Engines榜单后续,与阿里云达成全球独家战略合作

    2018年10月份,DB-Engines 发布了月全球数据库排名,排名前三的一如既往还是Oracle.MySQL.Microsoft SQL Server.排名是重要指标,同时增长率的重要性也同样备受 ...

  7. DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍

    DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍 1. 概述 近日来,ChatGPT及类似模型引发了人工智能(AI)领域的一场风潮. 这场风潮对数字世 ...

  8. WP老杨解迷:评论数和下载量、榜单的关系

    书接上回,继续研讨评论系统的深层经验,这次从另外一个角度看清榜单关系,提升装逼水准2个加号,如果你能看懂本文,并活学活用,足可在Win10之前醉卧隆中,通晓Windows Phone市场风云变幻,哪些 ...

  9. 【图文详解】scrapy安装与真的快速上手——爬取豆瓣9分榜单

    写在开头 现在scrapy的安装教程都明显过时了,随便一搜都是要你安装一大堆的依赖,什么装python(如果别人连python都没装,为什么要学scrapy….)wisted, zope interf ...

  10. [转载] 一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等

    原文: http://www.36dsj.com/archives/25042 接上一部分:一共81个,开源大数据处理工具汇总(上),第二部分主要收集整理的内容主要有日志收集系统.消息系统.分布式服务 ...

随机推荐

  1. Dotnet初探: 尝试使用 dotnet6 的miniapi

    引子 最近我们学校要求我们使用dotnet实现一个登录功能,由于我们学校的教程老旧(万年经典asp .net 4.x,慢的要死),我看有高性能又免费的Dotnet6不用,还又要退回几年前,于是决定另开 ...

  2. 程序猿要chatpgpt干掉了?

    如何拥抱被chatpgpt拉开的人工智能大时代 昨天 chatgpt-4 发布了.我看到好多技术圈的人都惶恐着,以后咱们都要失业了/(ㄒoㄒ)/~~ 和之前差不多的是毫无意外地又引动了一大波舆论.虽然 ...

  3. shell脚本编程(一)

    c81ba641-5ed7-4ab9-a7c0-e319e0f3890b 初识shell脚本编程 最近项目需求,需要了解下shell脚本编程,所以自己就必须玩玩了= = 初识shell脚本编程,找了几 ...

  4. Python 列表定义

    列表定义 由一系列按特定排序排列的元素组成,各元素之间无任何关系 用方括号[]来表示列表,并用逗号分隔其中的元素 访问列表元素 列表是有序集合,访问列表元素时,只需将该元素的位置或索引告知python ...

  5. Node.js躬行记(28)——Cypress自动化测试实践

    最近在研究如何提升项目质量,提炼了许多个用于自测的测试用例,但是每次修改后,都手工测试,成本太高,于是就想到了自动化测试. 在一年前已将 Cypress 集成到管理后台的项目中,不过没有投入到实践中. ...

  6. 使用4G通信模块和MQTT协议,完成物联网设备开发。

    使用4G通信模块和MQTT协议,完成物联网设备开发. (1)安装并使用4G模块通信模块,建立microPython开发环境: (2)使用提供的Demo开发例程,使用MQTT传输协议连接阿里或腾讯网站, ...

  7. 【C#代码整洁之道】读后习题

    1)劣质的代码会带来什么后果? GPT回答: 可维护性降低:代码过于复杂.难以理解.难以修改,导致维护成本增加,代码质量更加恶化. 可靠性降低:错误容易发生,很难找到并修复,因为代码模糊.逻辑混乱,并 ...

  8. APP中RN页面热更新流程-ReactNative源码分析

    平时使用WebStorm或VSCode对RN工程中的文件修改后,在键盘上按一下快捷cmd+s进行文件保存,此时当前调试的RN页面就会自动进行刷新,这是RN开发相比于原生开发一个很大的优点:热更新. 那 ...

  9. 从 DevOps 到平台工程:软件开发的新范式

    DevOps 是一种将开发和运营结合起来的方法,在应用规划.开发.交付和运营方面将人员.流程和技术结合起来.DevOps 使以前孤立的角色(如开发.IT运营.质量工程和安全)之间进行协调和合作.一直以 ...

  10. 工欲善其事必先利其器--CMake牛刀小试

    这里假设用户已经安装好MinGW编译套件!并配置好环境变量!具体怎么下载和配置网上教程非常多,这里贴上一个链接:不仅教你安装MinGW还教你安装VScode配置 1.学习c plus plus编码为什 ...