每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧!

重点内容

️ 道德与社会问题简报: 文生图模型中的偏见

最新一期的 Hugging Face 道德与社会“夏至”简报已经发布!这一简报对于道德与社会议题的关注非常重要,它为我们提供了一个平台来深入讨论和解决偏见问题。在本期简报中,我们详细探讨了文本生成图像系统中的偏见问题,并分享了如何应对的方法。

例如,如果训练数据主要是英文,它们可能传达相当西方化的价值观。结果我们得到了对不同或遥远文化的刻板印象。当我们比较 ERNIE ViLG (左) 和 Stable Diffusion v 2.1 (右) 对同一提示“北京的房子”的结果时,这种现象显得非常明显:

我们不仅调查了偏见的来源,还研究了如何检测带有偏见的输出,并进行了模型的红队测试,以及记录了测试结果。通过这些研究,我们希望能够启发更多关于如何共同解决这个问题的讨论。

我们深信,这些工作将继续鼓励合作和创新,我们希望大家积极参与讨论,分享你们的想法和解决方案。 阅读更多,请查阅我们的完整文章:《道德与社会问题简报 #4: 文生图模型中的偏见》

让 Whisper 一步到位地转录任何语言!

我们发现了一个小窍门,让 Whisper 可以直接转录任何语言(不仅仅是英语)!️ 输入你的音频,即可获得另一种语言的转录结果。 但请注意:目前这个小窍门还仍是试验性的,并非完全可靠,这项任务并不是模型专门训练过的,因此在使用之前请进行充分的测试

我们将进行更多的基准测试,并很快与大家分享我们的发现!

Whisper 是由 OpenAI 于 2022 年底发布的模型,至今在英语和多语言基准测试中具有接近最先进的性能。 该模型经过训练,可以执行两个关键的语音识别任务:️

  • 将给定语言( "X" )的音频转录成文本。
  • 将音频直接翻译为英语。即将语言为 "X" 的音频转录成英语。

随着世界变得越来越紧密相连,对高质量内容的需求也越来越大。使内容(尤其是音频)更易获取的一种方式是将其转录成不同的语言,从而确保知识的传播。️

从语言"X"的音频转录到另一种语言的典型工作流程如下:

  • 将语言 "X" 的音频翻译和转录成英语(Whisper 的基本功能)。
  • 将转录内容从语言"X"翻译成另一种语言(通常使用 LLM ,例如 GPT-3.5 / 4)。

这种方法非常有效!然而,与任何其他过程一样,运行的步骤越多,出错的可能性就越高。我们能否实现从语言 "X "转录到语言 "Y" 的一步到位呢?

事实证明,可以的!但是请记住️,这是一种窍门,尽管在我们的测试中似乎效果非常好,但对于严肃的使用该技术,需要进行更加充分的验证!这是因为该模型并没有针对我们将要使用它的任务进行训练,因此结果可能不太可靠。

我们将在以下 GitHub 的网址中仔细说明步骤,使用英语、德语、意大利语等语言做示范。如果你想要更互动的体验来了解更多信息,可以在 GitHub 文章中的 Colab 笔记本里跟随本教程亲手操作!‍ https://github.com/Vaibhavs10/translate-with-whisper

开源更新

Hugging Face AI 开源游戏竞赛获奖选手公布!

我们举办的 Game Jam 开源 AI 游戏挑战赛有超过来自全球 1000 多名开发者参加 一共收录了 88 个游戏 而最终的获奖选手是——

【视频号】

欢迎来尝试所有本次提交的 AI 小游戏:https://itch.io/jam/open-source-ai-game-jam/entries

如果想获取 Hugging Face 的最新资讯,也欢迎关注我们的小红书账号:@Hugging Face

https:hf.link/xhs

Llama 2 登陆 Hugging Face

Meta 刚刚发布了 LLaMa 2 并将模型发布在了 Hugging Face Hub 现在的模型单元和开源 LLM 榜单已经被它屠榜了

简单介绍一下 LLaMa 2 的特点:

  • 2T Tokens 进行训练
  • 允许商用
  • 基于聊天模式
  • 默认 4096 上下文 (可增加)
  • 7B, 13B & 70B 三种版本
  • LLaMa2-chat 与 ChatGPT 旗鼓相当
  • 开源!开源!开源!

欢迎大家来留言交流你的使用感受

社区活动

AI 头像变装秀最后一周冲刺!

Hugging Face 人气超高的 AI 头像变装秀即将进入尾声!在小红书的集美们热烈要求下,我们推出了一个重磅保姆级教程,手把手带你「轻松免费」生成自己的专属 AI 头像,仅需 3 分钟!

我们分享了一段 Stable Diffusion 的 Notebook 代码 ️ https://hf.link/tx 大家可用这段代码生成自己喜欢的头像,生成头像的风格不限

参与方式: 在使用我们提供的代码生成头像之后,请在你的小红书发布一篇笔记 分享你的成果或体验,并 @Hugging Face 官方账号让我们知道。

活动时间: 活动将在 7 月 31 日 (周一) 晚上 12 点截止,届时获赞最多的 前三名 小伙伴将获得神秘小惊喜

如果有疑问 请随时私信或留言!可到小红书查看活动详情,或者在公众号后台回复「头像」加入活动群。

Hugging Face ICML 2023 专区

ICML 2023 来啦!我们在 Hugging Face Spaces 建了一个专区,方便大家更好的了解本届 ICML 的新动向:

  • 如果你是参会者,请认领你的论文上传你的模型 / 数据集 / Demo,这也可以让更多社区内的开发者认识你和你的作品
  • 如果你是未来的参会者,在这里你可以同时看到感兴趣的论文 模型 / 数据集,并尝试 Demo

关于本专区,如果你有更好的意见和建议,请留言让我们知道 ️

https://hf.co/spaces/ICML2023/ICML2023_papers

编辑: Shawn


以上就是本期的 Hugging News,新的一周开始了,我们一起加油!

Hugging News #0724: Llama 2 登陆 Hugging Face、AI 开源游戏竞赛获奖选手公布!的更多相关文章

  1. 英特尔携手中国游戏开发者登陆 Unite Shanghai 2019 推动游戏产业创新

    2019 年 5 月 10 日-12 日,Unite Shanghai 2019 在上海召开.除了展示 Unity 的最新技术成就,以及出众的 Made with Unity 游戏与行业应用之外,大会 ...

  2. AI 影评家:用 Hugging Face 模型打造一个电影评分机器人

    本文为社区成员 Jun Chen 为 百姓 AI 和 Hugging Face 联合举办的黑客松所撰写的教程文档,欢迎你阅读今天的第二条推送了解和参加本次黑客松活动.文内含有较多链接,我们不再一一贴出 ...

  3. AutoLayout学习之理解intrinsicContentSize,Content Hugging Priority,Content Compression Resistance Priority

    TableViewCell的高度计算应该是所有开发者都会使用到的东西,之前都是用代码计算的方法来计算这个高度.最近有时间看了几个计算Cell高度的方法.基本上都用到了AutoLayout,这篇首先介绍 ...

  4. 使用 DeepSpeed 和 Hugging Face 🤗 Transformer 微调 FLAN-T5 XL/XXL

    Scaling Instruction-Finetuned Language Models 论文发布了 FLAN-T5 模型,它是 T5 模型的增强版.FLAN-T5 由很多各种各样的任务微调而得,因 ...

  5. Hugging Face 社区中蓬勃发展的计算机视觉

    在 Hugging Face 上,我们为与社区一起推动人工智能领域的民主化而感到自豪.作为这个使命的一部分,我们从去年开始专注于计算机视觉.开始只是 Transformers 中 Vision Tra ...

  6. ILLA Cloud: 调用 Hugging Face Inference Endpoints,开启大模型世界之门

    一个月前,我们 宣布了与 ILLA Cloud 与达成的合作,ILLA Cloud 正式支持集成 Hugging Face Hub 上的 AI 模型库和其他相关功能. 今天,我们为大家带来 ILLA ...

  7. 一步一步开发Game服务器(二)登陆2

    上一篇文章,讲解了简单的登陆情况.接下来我们继续讲解登陆模块. 在正常的游戏服务器情况下.在尚未登录前可以查看服务器大区情况,登陆后也可以查看服务器大区情况,然后选择大区服务器.进行登录操作. 这样的 ...

  8. 第 1 天|基于 AI 进行游戏开发:5 天创建一个农场游戏!

    欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用各种 AI 工具,在 5 天内创建一个功能完备的农场游戏.到本系列结束时,你将了解到如何将多种 AI 工具整合到游戏开发流程中.本系列文章将向你展 ...

  9. AIGC 很火,想微调个自己的模型试试看?(不是卖课的)

    去年,我们发布过一篇关于 DreamBooth 编程马拉松的活动通知,获得了全球社区的广泛关注和参与,中国社区的成员们也对这个活动有非常高的热情.同时我们也收到了后台留言反馈说参与活动需要使用的 Go ...

  10. AI 制作 3D 素材|基于 AI 5 天创建一个农场游戏,第 3 天

    欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏.到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中.本文将向您展示如何将 A ...

随机推荐

  1. Linux rsyslogd服务学习

    本篇笔记来自该博客: http://c.biancheng.net/view/1097.html 服务简介 在CentOS 6.x 中日志服务已经由 rsyslogd 取代了原先的 syslogd.r ...

  2. SkyWalking的学习之一

    SkyWalking的学习之一 前言 最近在学习应用调优诊断等内容. 现在实际工作中实质上的拆分和微服务在售前阶段 所以真正用到链路的地方比较少. 但是人生都是要向前看的. 想着一方面提高自己. 一方 ...

  3. 沁恒 CH32V208(一): CH32V208WBU6 评估板上手报告和Win10环境配置

    目录 沁恒 CH32V208(一): CH32V208WBU6 评估板上手报告和Win10环境配置 CH32V208 CH32V208系列是沁恒32位RISC-V中比较新的一个系列, 基于青稞RISC ...

  4. 用Python语言进行时间序列ARIMA模型分析

    应用时间序列 时间序列分析是一种重要的数据分析方法,应用广泛.以下列举了几个时间序列分析的应用场景: 1.经济预测:时间序列分析可以用来分析经济数据,预测未来经济趋势和走向.例如,利用历史股市数据和经 ...

  5. 2022-12-18:给定一个长度为n的二维数组graph,代表一张图, graph[i] = {a,b,c,d} 表示i讨厌(a,b,c,d),讨厌关系为双向的, 一共有n个人,编号0~n-1, 讨

    2022-12-18:给定一个长度为n的二维数组graph,代表一张图, graph[i] = {a,b,c,d} 表示i讨厌(a,b,c,d),讨厌关系为双向的, 一共有n个人,编号0~n-1, 讨 ...

  6. 2020-12-01:java中,什么是安全点和安全区域?

    福哥答案2020-12-04: 安全点用户线程暂停,GC 线程要开始工作,但是要确保用户线程暂停的这行字节码指令是不会导致引用关系的变化.所以 JVM 会在字节码指令中,选一些指令,作为"安 ...

  7. 大三ACM第一次开会

    现在是2020.9.12,单说时间的话可能感知不太强,那么换个时间, 现在是大三上.按照设想,我应该已经退役. 会上,老李的语气不再激昂,满含着无奈与沧桑.面对围在桌前的大三们,终究还是提出了那个问题 ...

  8. 代码随想录算法训练营Day46 动态规划

    代码随想录算法训练营 代码随想录算法训练营Day46 动态规划| ●  139.单词拆分 关于多重背包,你该了解这些! 背包问题总结篇! 139.单词拆分 题目链接:139.单词拆分 给定一个非空字符 ...

  9. Linux 上的 .NET 崩溃了怎么抓 Dump

    一:背景 1. 讲故事 训练营中有朋友问在 Linux 上如何抓 crash dump,在我的系列文章中演示的大多是在 Windows 平台上,这也没办法要跟着市场走,谁让 .NET 的主战场在工控 ...

  10. 1 msql的安装和配置

    1.检测系统是否已经安装过mysql或其依赖,若已装过要先将其删除,否则第4步使用yum安装时会报错: yum list installed | grep mysql mysql-libs.i686 ...