数字人 —— 虚拟人 —— Inworld AI用生成式AI——生成式游戏NPC
相关:
https://www.ithome.com/0/756/603.htm
https://baijiahao.baidu.com/s?id=1774732295233220838
https://www.nvidia.cn/geforce/news/nvidia-ace-gdc-gtc-2024-ai-character-game-and-app-demo-videos/
https://www.youtube.com/watch?v=uryeFhnNzEs
NVIDIA ACE 技术通过我们的平台合作伙伴 (例如 Inworld AI) 提供给游戏开发者使用,并呈现给游戏玩家进行体验。Inworld 的 AI 引擎为开发者提供了一个基础平台,他们可以利用该平台在游戏中构建数字人和角色。
在 GDC 2024 上,Inworld 和 NVIDIA 联合公布了一项全新技术 Demo- Covert Protocol,用于展示 NVIDIA ACE 技术和 Inworld 的 AI 引擎。Covert Protocol 旨在展示通过生成式 AI 可以实现的各种全新类型的游戏体验。在这个技术 Demo 中,您将扮演一名私家侦探,根据与场景中角色的对话结果来完成目标。
Covert Protocol 包括两项集成到 Inworld 角色引擎中的 ACE 技术:NVIDIA Riva 自动语音识别和 NVIDIA Audio2Face。Covert Protocol 基于虚幻引擎 5 开发,利用 Inworld 的虚幻引擎插件,可以更快速简单地使用虚幻引擎 MetaHuman。
数字人技术套件包括由 AI 驱动的语言、语音、动画和图形:
●NVIDIA ACE — 可帮助开发者通过由 NVIDIA Audio2Face驱动的面部动画以及由 NVIDIA Riva 自动语音识别 (ASR) 和文本转语音 (TTS) 驱动的语音交流,让数字人栩栩如生。ACE 微服务非常灵活,允许模型根据本地 GPU 的性能在云端和 PC 上运行,以确保用户获得最佳体验。
●NVIDIA NeMo — 一个端到端平台,可帮助开发者提供企业级的生成式 AI 模型,包括精确的数据管护、先进的模型个性化定制、检索增强生成和加速性能。
●NVIDIA RTX — RTX 全局光照 (RTXGI) 和 DLSS 3.5 等渲染技术的集合,可在游戏和应用中实现实时路径追踪。


NVIDIA公司新推出的一个技术产品,使动画人物的表现更加有个性并且更加像人,可以说这个技术就是使NPC中的角色栩栩如生,在游戏领域增加游戏沉浸感,并通过提供前沿的视觉效果和逼真的动画在数字人对话领域有更好的表现。
具体使用到的NVIDIA技术:
NVIDIA ACE 技术套件中的 NVIDIA Omniverse Audio2Face 为 NPC 的面部提供实时面部表情(面部动画)和口型同步,提供逼真的面部表情。
NVIDIA Riva 可实现精确的语音转换文字。
NVIDIA Animation graph 应用于骨骼动画合成、回放和控制的一个 runtime 框架。其实这就是一个制作动画人物的一个引擎软件,制作好的动画人物是可以具有一定动作的。
大语言模型,根据预先给定的上下文(完整的背景)、知识库和不同的对话风格进行语言对话。
总结来说,就是使用“Animation graph”制作出一个动画人物,并用“大语言模型”赋予其语言对话的能力,然后使用“NVIDIA Riva”对游戏参与者(打游戏的人)的麦克风输入的语音转换为文字输入给大语言模型并且将大语言模型的语言回复转为声音外放输出,在和动画人物交互的同时“Audio2Face”会根据对话的语音提供实时的面部表情和口型,总的目标就是让数字人可以更加的逼真。
给出一个NVIDIA技术之上构建的一个数字人对话的产品:
https://www.digitalhumans.com/

感觉这个技术确实比之前的那种特别僵硬的“数字人”要好很多,说话的口型也感觉更加的自然,但是总的感觉还是和真人有一定的距离,现在的这个水平感觉和普通动漫电影中的人物表现有些像(甚至要强一些),但是依然没有3D大电影(如:阿凡达,等等)中的数字人那么逼真,当然,和真实人类表现的距离就更远了。
PS. 真理的数字人完全是电脑生成的,动漫的数字人需要人类手动去画细节表现,3D大电影中的人物往往需要真实的人在绿幕前面戴着传感器进行真实的动作表现后采集数据再转为数字人,所以从这个角度来说,这个数字人的表现已经是很不错的,从这个提高生动性的这个目的来看也是可以做到的。
数字人 —— 虚拟人 —— Inworld AI用生成式AI——生成式游戏NPC的更多相关文章
- 百度生成式AI产品文心一言邀你体验AI创作新奇迹:百度CEO李彦宏详细透露三大产业将会带来机遇(文末附文心一言个人用户体验测试邀请码获取方法,亲测有效)
目录 中国版ChatGPT上线发布 强大中文理解能力 智能文学创作.商业文案创作 图片.视频智能生成 中国生成式AI三大产业机会 新型云计算公司 行业模型精调公司 应用服务提供商 总结 获取文心一言邀 ...
- 生成式AI会成为是人工智能的未来吗
生成式 AI 是一项创新技术,可帮助算法人员生成以前依赖于业务员的模型,提供创造性的结果,而不会因业务员思想和经验而产生任何差错. 人工智能中的这项新技术确定了输入的原始模型,以生成演示训练数据特征. ...
- 生成式AI对业务流程有哪些影响?企业如何应用生成式AI?一文看懂
集成与融合类ChatGPT工具与技术,以生成式AI变革业务流程 ChatGPT背后的生成式AI,聊聊生成式AI如何改变业务流程 ChatGPT月活用户过亿,生成式AI对组织的业务流程有哪些影响? 生成 ...
- 乘风破浪,遇见未来元宇宙(Metaverse)之进入元宇宙世界,虚拟数字人行业洞察报告
正值元宇宙热潮,虚拟数字人兴起 作为⼀个新兴领域,虚拟数字⼈已经引起市场和资本的⾼度关注,截⾄目前据不完全统计,全球范围已有500+虚拟数字人相关项目获得融资,融资总额超10亿美元,并且融资项目和总额 ...
- Python 函数递归-三元表达式-列表生成式-字典生成式-匿名函数-内置函数
上节课复习: 1. 无参装饰器 def 装饰器名字(func): def wrapper(*args,**kwargs): res = func(*args,**kwargs) return res ...
- Python 列表生成式 & 字典生成式
Python 列表生成式 & 字典生成式 通过生成式可以更加简洁地生成列表和字典 列表生成式 对比 直接生成数据后加入列表示例: user_list = list() for i in ran ...
- AI 判别式模型和生成式模型
判别式模型(discriminative model) 生成式模型(generative model) 对于输入x,类别标签y:产生式模型估计它们的联合概率分布P(x,y)判别式模型估计条件概率分布P ...
- 24分钟让AI跑起飞车类游戏
本文由云+社区发表 作者:WeTest小编 WeTest 导读 本文主要介绍如何让AI在24分钟内学会玩飞车类游戏.我们使用Distributed PPO训练AI,在短时间内可以取得不错的训练效果. ...
- 从服务器角度分析RPG游戏——NPC的AI
最近主程有些忙,甩给我一些服务器的代码,零零散散总结了一些要素. java程序架构也是层层分析,先罗列出需要做的工作,然后从主干到细节依次实现.就这点而言,程序和绘画有很多类似的地方. 关于怪物AI类 ...
- Excel催化剂开源第25波-Excel调用百度AI,返回AI结果
现成的这些轮子,无需调用网页,直接本地离线即可生成). 当然在AI时代,少不了各种AI接口的使用场景,普通开发者只需聚焦在自己的业务场景上,这些AI底层技术,只需类似水煤电一般去BAT这些大厂那里去消 ...
随机推荐
- JS获取表单所有内容
var formData = {}; var t = $('#Form').serializeArray(); $.each(t, function() { formData[this.name] = ...
- 使用 OpenTelemetry 构建可观测性 04 - 收集器
在之前的博文中,我们讨论了如何使用 SDK 和链路追踪生产者来导出进程中的遥测数据.尽管有多种类型的导出器可供选择,但其中一个常见的目标是将数据导出到 OpenTelemetry Collector. ...
- HBCK2修复hbase2的常见场景
上一文章已经把HBCK2 怎么在小于hbase2.0.3版本的编译与用法介绍了,解决主要场景 查看hbase存在的问题 一.使用hbase hbck命令 hbase hbck命令是对hbase的元数据 ...
- Kotlin 变量详解:声明、赋值与最佳实践指南
Kotlin 变量 变量是用于存储数据值的容器. 要创建一个变量,使用 var 或 val,然后使用等号(=)给它赋值: 语法 var 变量名 = 值 val 变量名 = 值 示例 var name ...
- 为什么不推荐使用Linq?
相信很多.NETer看了标题,都会忍不住好奇,点进来看看,并且顺便准备要喷作者! 这里,首先要申明一下,作者本人也非常喜欢Linq,也在各个项目中常用Linq. 我爱Linq,Linq优雅万岁!!!( ...
- NXP i.MX 6ULL工业开发板规格书( ARM Cortex-A7,主频792MHz)
1 评估板简介 创龙科技TLIMX6U-EVM是一款基于NXP i.MX 6ULL的ARM Cortex-A7高性能低功耗处理器设计的评估板,由核心板和评估底板组成.核心板经过专业的PCB Layou ...
- 自己写一个 NODE/ATTR 的结构
## python 3.8 以上 from typing import Dict, List, TypeVar, Tuple, Generic, get_args import json T = Ty ...
- JVM(Java虚拟机) 整理(一):基础理论
JVM整体结构 本文主要说的是HotSpot虚拟机, JVM 全称是 Java Virtual Machine,中文译名:Java虚拟机 简化一下: Java字节码文件 Class文件本质上是一个以8 ...
- 量子位(qubit)发微
上一篇文章我们讲了量子计算机的一些概念,文章不短,但是信息量很少.这里继续深入量子机来揭开qubit的神秘面纱. 这篇文章会有一些数学概念,不过很简单 量子叠加 量子叠加非常重要,因为qubit就是利 ...
- VUE商城项目 -商品分类功能 - 手稿