相关:

https://www.ithome.com/0/756/603.htm

https://baijiahao.baidu.com/s?id=1774732295233220838

https://www.nvidia.cn/geforce/news/nvidia-ace-gdc-gtc-2024-ai-character-game-and-app-demo-videos/

https://www.youtube.com/watch?v=uryeFhnNzEs

NVIDIA ACE 技术通过我们的平台合作伙伴 (例如 Inworld AI) 提供给游戏开发者使用,并呈现给游戏玩家进行体验。Inworld 的 AI 引擎为开发者提供了一个基础平台,他们可以利用该平台在游戏中构建数字人和角色。

在 GDC 2024 上,Inworld 和 NVIDIA 联合公布了一项全新技术 Demo- Covert Protocol,用于展示 NVIDIA ACE 技术和 Inworld 的 AI 引擎。Covert Protocol 旨在展示通过生成式 AI 可以实现的各种全新类型的游戏体验。在这个技术 Demo 中,您将扮演一名私家侦探,根据与场景中角色的对话结果来完成目标。

Covert Protocol 包括两项集成到 Inworld 角色引擎中的 ACE 技术:NVIDIA Riva 自动语音识别和 NVIDIA Audio2Face。Covert Protocol 基于虚幻引擎 5 开发,利用 Inworld 的虚幻引擎插件,可以更快速简单地使用虚幻引擎 MetaHuman。

数字人技术套件包括由 AI 驱动的语言、语音、动画和图形:

●NVIDIA ACE — 可帮助开发者通过由 NVIDIA Audio2Face驱动的面部动画以及由 NVIDIA Riva 自动语音识别 (ASR) 和文本转语音 (TTS) 驱动的语音交流,让数字人栩栩如生。ACE 微服务非常灵活,允许模型根据本地 GPU 的性能在云端和 PC 上运行,以确保用户获得最佳体验。

●NVIDIA NeMo — 一个端到端平台,可帮助开发者提供企业级的生成式 AI 模型,包括精确的数据管护、先进的模型个性化定制、检索增强生成和加速性能。

●NVIDIA RTX — RTX 全局光照 (RTXGI) 和 DLSS 3.5 等渲染技术的集合,可在游戏和应用中实现实时路径追踪。

NVIDIA公司新推出的一个技术产品,使动画人物的表现更加有个性并且更加像人,可以说这个技术就是使NPC中的角色栩栩如生,在游戏领域增加游戏沉浸感,并通过提供前沿的视觉效果和逼真的动画在数字人对话领域有更好的表现。

具体使用到的NVIDIA技术:

  • NVIDIA ACE 技术套件中的 NVIDIA Omniverse Audio2Face 为 NPC 的面部提供实时面部表情(面部动画)和口型同步,提供逼真的面部表情。

  • NVIDIA Riva 可实现精确的语音转换文字。

  • NVIDIA Animation graph 应用于骨骼动画合成、回放和控制的一个 runtime 框架。其实这就是一个制作动画人物的一个引擎软件,制作好的动画人物是可以具有一定动作的。

  • 大语言模型,根据预先给定的上下文(完整的背景)、知识库和不同的对话风格进行语言对话。

总结来说,就是使用“Animation graph”制作出一个动画人物,并用“大语言模型”赋予其语言对话的能力,然后使用“NVIDIA Riva”对游戏参与者(打游戏的人)的麦克风输入的语音转换为文字输入给大语言模型并且将大语言模型的语言回复转为声音外放输出,在和动画人物交互的同时“Audio2Face”会根据对话的语音提供实时的面部表情和口型,总的目标就是让数字人可以更加的逼真。


给出一个NVIDIA技术之上构建的一个数字人对话的产品:

https://www.digitalhumans.com/

感觉这个技术确实比之前的那种特别僵硬的“数字人”要好很多,说话的口型也感觉更加的自然,但是总的感觉还是和真人有一定的距离,现在的这个水平感觉和普通动漫电影中的人物表现有些像(甚至要强一些),但是依然没有3D大电影(如:阿凡达,等等)中的数字人那么逼真,当然,和真实人类表现的距离就更远了。

PS. 真理的数字人完全是电脑生成的,动漫的数字人需要人类手动去画细节表现,3D大电影中的人物往往需要真实的人在绿幕前面戴着传感器进行真实的动作表现后采集数据再转为数字人,所以从这个角度来说,这个数字人的表现已经是很不错的,从这个提高生动性的这个目的来看也是可以做到的。

数字人 —— 虚拟人 —— Inworld AI用生成式AI——生成式游戏NPC的更多相关文章

  1. 百度生成式AI产品文心一言邀你体验AI创作新奇迹:百度CEO李彦宏详细透露三大产业将会带来机遇(文末附文心一言个人用户体验测试邀请码获取方法,亲测有效)

    目录 中国版ChatGPT上线发布 强大中文理解能力 智能文学创作.商业文案创作 图片.视频智能生成 中国生成式AI三大产业机会 新型云计算公司 行业模型精调公司 应用服务提供商 总结 获取文心一言邀 ...

  2. 生成式AI会成为是人工智能的未来吗

    生成式 AI 是一项创新技术,可帮助算法人员生成以前依赖于业务员的模型,提供创造性的结果,而不会因业务员思想和经验而产生任何差错. 人工智能中的这项新技术确定了输入的原始模型,以生成演示训练数据特征. ...

  3. 生成式AI对业务流程有哪些影响?企业如何应用生成式AI?一文看懂

    集成与融合类ChatGPT工具与技术,以生成式AI变革业务流程 ChatGPT背后的生成式AI,聊聊生成式AI如何改变业务流程 ChatGPT月活用户过亿,生成式AI对组织的业务流程有哪些影响? 生成 ...

  4. 乘风破浪,遇见未来元宇宙(Metaverse)之进入元宇宙世界,虚拟数字人行业洞察报告

    正值元宇宙热潮,虚拟数字人兴起 作为⼀个新兴领域,虚拟数字⼈已经引起市场和资本的⾼度关注,截⾄目前据不完全统计,全球范围已有500+虚拟数字人相关项目获得融资,融资总额超10亿美元,并且融资项目和总额 ...

  5. Python 函数递归-三元表达式-列表生成式-字典生成式-匿名函数-内置函数

    上节课复习: 1. 无参装饰器 def 装饰器名字(func): def wrapper(*args,**kwargs): res = func(*args,**kwargs) return res ...

  6. Python 列表生成式 & 字典生成式

    Python 列表生成式 & 字典生成式 通过生成式可以更加简洁地生成列表和字典 列表生成式 对比 直接生成数据后加入列表示例: user_list = list() for i in ran ...

  7. AI 判别式模型和生成式模型

    判别式模型(discriminative model) 生成式模型(generative model) 对于输入x,类别标签y:产生式模型估计它们的联合概率分布P(x,y)判别式模型估计条件概率分布P ...

  8. 24分钟让AI跑起飞车类游戏

    本文由云+社区发表 作者:WeTest小编 WeTest 导读 本文主要介绍如何让AI在24分钟内学会玩飞车类游戏.我们使用Distributed PPO训练AI,在短时间内可以取得不错的训练效果. ...

  9. 从服务器角度分析RPG游戏——NPC的AI

    最近主程有些忙,甩给我一些服务器的代码,零零散散总结了一些要素. java程序架构也是层层分析,先罗列出需要做的工作,然后从主干到细节依次实现.就这点而言,程序和绘画有很多类似的地方. 关于怪物AI类 ...

  10. Excel催化剂开源第25波-Excel调用百度AI,返回AI结果

    现成的这些轮子,无需调用网页,直接本地离线即可生成). 当然在AI时代,少不了各种AI接口的使用场景,普通开发者只需聚焦在自己的业务场景上,这些AI底层技术,只需类似水煤电一般去BAT这些大厂那里去消 ...

随机推荐

  1. kettle从入门到精通 第十二课 kettle java代码过滤记录、利用Janino计算Java表达式

    1.下图通过简单的示例讲解了根据java代码过滤记录和利用Janino计算Java表达式两个组件. 2.根据java代码过滤记录 1)步骤名称:自定义 2)接收匹配的行的步骤(可选):下面条件(jav ...

  2. INFINI Labs 产品更新 | 发布 Easysearch Java 客户端,Console 支持 SQL 查询等功能

    近年来,日志管理平台越来越流行.使用日志管理平台可以实时地.统一地.方便地管理和查看日志,挖掘日志数据价值,驱动运维.运营,提升服务管理效率. 方案架构 Beats 是轻量级采集器,包括 Filebe ...

  3. filebeat实战

    1.打开filebeat支持nginx模块 [root@es-node1 /etc/filebeat]#ls fields.yml filebeat.reference.yml filebeat.ym ...

  4. 网易面试:SpringBoot如何开启虚拟线程?

    虚拟线程(Virtual Thread)也称协程或纤程,是一种轻量级的线程实现,与传统的线程以及操作系统级别的线程(也称为平台线程)相比,它的创建开销更小.资源利用率更高,是 Java 并发编程领域的 ...

  5. 在MySQL中INNER JOIN、LEFT JOIN、RIGHT JOIN 和 FULL JOIN 有什么区别?

    我们有两张表: TableA:id  firstName                  lastName.......................................1   aru ...

  6. 浅谈 DDD 领域驱动设计

    文章简介 在B端产品研发及项目实施中,DDD带给我们哪些思考?我们是如何应用的?本文不是科普贴,旨在分享我们的经历和思考. 背景 Domain Driven Design(简称 DDD),又称为领域驱 ...

  7. POJ2247,hdu1058(Humble Numbers)

    Problem Description A number whose only prime factors are 2,3,5 or 7 is called a humble number. The ...

  8. 李沐多模态串讲视频总结 ALBEF VLMo BLIP CoCa BEITv3 模型简要介绍

    开场 多模态串讲的上篇是比较传统的多模态任务 多模态最后的模态交互很重要 传统的缺点是都用了预训练的目标检测器,训练和部署都很困难. ViLT 把预训练的目标检测器换成了一层的 Patch Embed ...

  9. VSCode因网络问题导致下载更新/扩展出错

    VSCode因网络问题导致下载更新/扩展出错 可尝试方法:   问题0: VSCode出现网络问题排查方法?       法1: 启动时加上选项 --log-net-log=netlog.json   ...

  10. TI AM62x工业开发板规格书(单/双/四核ARM Cortex-A53 + 单核ARM Cortex-M4F,主频1.4GHz)

    1 评估板简介 创龙科技TL62x-EVM是一款基于TI Sitara系列AM62x单/双/四核ARM Cortex-A53 + 单核ARM Cortex-M4F多核处理器设计的高性能低功耗工业评估板 ...