数字人 —— 虚拟人 —— Inworld AI用生成式AI——生成式游戏NPC
相关:
https://www.ithome.com/0/756/603.htm
https://baijiahao.baidu.com/s?id=1774732295233220838
https://www.nvidia.cn/geforce/news/nvidia-ace-gdc-gtc-2024-ai-character-game-and-app-demo-videos/
https://www.youtube.com/watch?v=uryeFhnNzEs
NVIDIA ACE 技术通过我们的平台合作伙伴 (例如 Inworld AI) 提供给游戏开发者使用,并呈现给游戏玩家进行体验。Inworld 的 AI 引擎为开发者提供了一个基础平台,他们可以利用该平台在游戏中构建数字人和角色。
在 GDC 2024 上,Inworld 和 NVIDIA 联合公布了一项全新技术 Demo- Covert Protocol,用于展示 NVIDIA ACE 技术和 Inworld 的 AI 引擎。Covert Protocol 旨在展示通过生成式 AI 可以实现的各种全新类型的游戏体验。在这个技术 Demo 中,您将扮演一名私家侦探,根据与场景中角色的对话结果来完成目标。
Covert Protocol 包括两项集成到 Inworld 角色引擎中的 ACE 技术:NVIDIA Riva 自动语音识别和 NVIDIA Audio2Face。Covert Protocol 基于虚幻引擎 5 开发,利用 Inworld 的虚幻引擎插件,可以更快速简单地使用虚幻引擎 MetaHuman。
数字人技术套件包括由 AI 驱动的语言、语音、动画和图形:
●NVIDIA ACE — 可帮助开发者通过由 NVIDIA Audio2Face驱动的面部动画以及由 NVIDIA Riva 自动语音识别 (ASR) 和文本转语音 (TTS) 驱动的语音交流,让数字人栩栩如生。ACE 微服务非常灵活,允许模型根据本地 GPU 的性能在云端和 PC 上运行,以确保用户获得最佳体验。
●NVIDIA NeMo — 一个端到端平台,可帮助开发者提供企业级的生成式 AI 模型,包括精确的数据管护、先进的模型个性化定制、检索增强生成和加速性能。
●NVIDIA RTX — RTX 全局光照 (RTXGI) 和 DLSS 3.5 等渲染技术的集合,可在游戏和应用中实现实时路径追踪。
NVIDIA公司新推出的一个技术产品,使动画人物的表现更加有个性并且更加像人,可以说这个技术就是使NPC中的角色栩栩如生,在游戏领域增加游戏沉浸感,并通过提供前沿的视觉效果和逼真的动画在数字人对话领域有更好的表现。
具体使用到的NVIDIA技术:
NVIDIA ACE 技术套件中的 NVIDIA Omniverse Audio2Face 为 NPC 的面部提供实时面部表情(面部动画)和口型同步,提供逼真的面部表情。
NVIDIA Riva 可实现精确的语音转换文字。
NVIDIA Animation graph 应用于骨骼动画合成、回放和控制的一个 runtime 框架。其实这就是一个制作动画人物的一个引擎软件,制作好的动画人物是可以具有一定动作的。
大语言模型,根据预先给定的上下文(完整的背景)、知识库和不同的对话风格进行语言对话。
总结来说,就是使用“Animation graph”制作出一个动画人物,并用“大语言模型”赋予其语言对话的能力,然后使用“NVIDIA Riva”对游戏参与者(打游戏的人)的麦克风输入的语音转换为文字输入给大语言模型并且将大语言模型的语言回复转为声音外放输出,在和动画人物交互的同时“Audio2Face”会根据对话的语音提供实时的面部表情和口型,总的目标就是让数字人可以更加的逼真。
给出一个NVIDIA技术之上构建的一个数字人对话的产品:
https://www.digitalhumans.com/
感觉这个技术确实比之前的那种特别僵硬的“数字人”要好很多,说话的口型也感觉更加的自然,但是总的感觉还是和真人有一定的距离,现在的这个水平感觉和普通动漫电影中的人物表现有些像(甚至要强一些),但是依然没有3D大电影(如:阿凡达,等等)中的数字人那么逼真,当然,和真实人类表现的距离就更远了。
PS. 真理的数字人完全是电脑生成的,动漫的数字人需要人类手动去画细节表现,3D大电影中的人物往往需要真实的人在绿幕前面戴着传感器进行真实的动作表现后采集数据再转为数字人,所以从这个角度来说,这个数字人的表现已经是很不错的,从这个提高生动性的这个目的来看也是可以做到的。
数字人 —— 虚拟人 —— Inworld AI用生成式AI——生成式游戏NPC的更多相关文章
- 百度生成式AI产品文心一言邀你体验AI创作新奇迹:百度CEO李彦宏详细透露三大产业将会带来机遇(文末附文心一言个人用户体验测试邀请码获取方法,亲测有效)
目录 中国版ChatGPT上线发布 强大中文理解能力 智能文学创作.商业文案创作 图片.视频智能生成 中国生成式AI三大产业机会 新型云计算公司 行业模型精调公司 应用服务提供商 总结 获取文心一言邀 ...
- 生成式AI会成为是人工智能的未来吗
生成式 AI 是一项创新技术,可帮助算法人员生成以前依赖于业务员的模型,提供创造性的结果,而不会因业务员思想和经验而产生任何差错. 人工智能中的这项新技术确定了输入的原始模型,以生成演示训练数据特征. ...
- 生成式AI对业务流程有哪些影响?企业如何应用生成式AI?一文看懂
集成与融合类ChatGPT工具与技术,以生成式AI变革业务流程 ChatGPT背后的生成式AI,聊聊生成式AI如何改变业务流程 ChatGPT月活用户过亿,生成式AI对组织的业务流程有哪些影响? 生成 ...
- 乘风破浪,遇见未来元宇宙(Metaverse)之进入元宇宙世界,虚拟数字人行业洞察报告
正值元宇宙热潮,虚拟数字人兴起 作为⼀个新兴领域,虚拟数字⼈已经引起市场和资本的⾼度关注,截⾄目前据不完全统计,全球范围已有500+虚拟数字人相关项目获得融资,融资总额超10亿美元,并且融资项目和总额 ...
- Python 函数递归-三元表达式-列表生成式-字典生成式-匿名函数-内置函数
上节课复习: 1. 无参装饰器 def 装饰器名字(func): def wrapper(*args,**kwargs): res = func(*args,**kwargs) return res ...
- Python 列表生成式 & 字典生成式
Python 列表生成式 & 字典生成式 通过生成式可以更加简洁地生成列表和字典 列表生成式 对比 直接生成数据后加入列表示例: user_list = list() for i in ran ...
- AI 判别式模型和生成式模型
判别式模型(discriminative model) 生成式模型(generative model) 对于输入x,类别标签y:产生式模型估计它们的联合概率分布P(x,y)判别式模型估计条件概率分布P ...
- 24分钟让AI跑起飞车类游戏
本文由云+社区发表 作者:WeTest小编 WeTest 导读 本文主要介绍如何让AI在24分钟内学会玩飞车类游戏.我们使用Distributed PPO训练AI,在短时间内可以取得不错的训练效果. ...
- 从服务器角度分析RPG游戏——NPC的AI
最近主程有些忙,甩给我一些服务器的代码,零零散散总结了一些要素. java程序架构也是层层分析,先罗列出需要做的工作,然后从主干到细节依次实现.就这点而言,程序和绘画有很多类似的地方. 关于怪物AI类 ...
- Excel催化剂开源第25波-Excel调用百度AI,返回AI结果
现成的这些轮子,无需调用网页,直接本地离线即可生成). 当然在AI时代,少不了各种AI接口的使用场景,普通开发者只需聚焦在自己的业务场景上,这些AI底层技术,只需类似水煤电一般去BAT这些大厂那里去消 ...
随机推荐
- INFINI Labs 产品更新 | Easysearch 优化字段压缩提升写入速度,Console 优化数据迁移和校验等功能
INFINI Labs 产品又更新啦~.本次更新概要如下:Easysearch 增强 source_reuse 压缩功能,并大幅提升写入速度:Console 优化了数据迁移和校验功能,新增了通用的数据 ...
- CentOS7打开终端快捷键
点击右上角的用户名,选择设置>>键盘>>快捷键,然后点+,名称自己写,命令是"/usr/bin/gnome-terminal",这个是不能改的,再点应用,这 ...
- C#.NET AES ECB 加密
加密: /// <summary> /// 加密 /// </summary> /// <param name="content">要加密的串& ...
- golang reflect 反射机制的使用场景
Go语言中的 reflect 包提供了运行时反射机制,允许程序在运行时检查和操作任意对象的数据类型和值. 以下是 reflect 包的一些典型使用场景: 1. 动态类型判断与转换:当需要处理多种类型的 ...
- HBCK2修复hbase2的常见场景
上一文章已经把HBCK2 怎么在小于hbase2.0.3版本的编译与用法介绍了,解决主要场景 查看hbase存在的问题 一.使用hbase hbck命令 hbase hbck命令是对hbase的元数据 ...
- Python 压缩PDF减小文件大小
压缩 PDF 文件能有效减小文件大小并提高文件传输的效率,同时还能节省计算机存储空间.除了使用一些专业工具对PDF文件进行压缩,我们还可以通过 Python 来执行该操作,实现自动化.批量处理PDF文 ...
- 记录一下第一次webSocket通信成功
webSocket前端代码 <!DOCTYPE html> <html lang="en"> <head> <meta charset=& ...
- 在WPF中使用WriteableBitmap对接工业相机及常用操作
写作背景 写这篇文章主要是因为工业相机(海康.大恒等)提供的.NET开发文档和示例程序都是用WinForm项目来说明举例的,而在WPF项目中对图像的使用和处理与在WinForm项目中有很大不同.在Wi ...
- 《DNK210使用指南 -CanMV版 V1.0》第一章 本书学习方法
第一章 本书学习方法 1)实验平台:正点原子DNK210开发板 2)章节摘自[正点原子]DNK210使用指南 - CanMV版 V1.0 3)购买链接:https://detail.tmall.com ...
- T3/A40i支持Linux-5.10新内核啦,Docker、Qt、Python统统升级!
自2021年创龙科技推出全志国产化率100%的T3/A40i工业核心板后,不到两年时间已超过800家工业客户选择创龙科技T3/A40i平台.随着客户产品的不断升级与迭代,部分"能源电力&qu ...