相关:

https://www.ithome.com/0/756/603.htm

https://baijiahao.baidu.com/s?id=1774732295233220838

https://www.nvidia.cn/geforce/news/nvidia-ace-gdc-gtc-2024-ai-character-game-and-app-demo-videos/

https://www.youtube.com/watch?v=uryeFhnNzEs

NVIDIA ACE 技术通过我们的平台合作伙伴 (例如 Inworld AI) 提供给游戏开发者使用,并呈现给游戏玩家进行体验。Inworld 的 AI 引擎为开发者提供了一个基础平台,他们可以利用该平台在游戏中构建数字人和角色。

在 GDC 2024 上,Inworld 和 NVIDIA 联合公布了一项全新技术 Demo- Covert Protocol,用于展示 NVIDIA ACE 技术和 Inworld 的 AI 引擎。Covert Protocol 旨在展示通过生成式 AI 可以实现的各种全新类型的游戏体验。在这个技术 Demo 中,您将扮演一名私家侦探,根据与场景中角色的对话结果来完成目标。

Covert Protocol 包括两项集成到 Inworld 角色引擎中的 ACE 技术:NVIDIA Riva 自动语音识别和 NVIDIA Audio2Face。Covert Protocol 基于虚幻引擎 5 开发,利用 Inworld 的虚幻引擎插件,可以更快速简单地使用虚幻引擎 MetaHuman。

数字人技术套件包括由 AI 驱动的语言、语音、动画和图形:

●NVIDIA ACE — 可帮助开发者通过由 NVIDIA Audio2Face驱动的面部动画以及由 NVIDIA Riva 自动语音识别 (ASR) 和文本转语音 (TTS) 驱动的语音交流,让数字人栩栩如生。ACE 微服务非常灵活,允许模型根据本地 GPU 的性能在云端和 PC 上运行,以确保用户获得最佳体验。

●NVIDIA NeMo — 一个端到端平台,可帮助开发者提供企业级的生成式 AI 模型,包括精确的数据管护、先进的模型个性化定制、检索增强生成和加速性能。

●NVIDIA RTX — RTX 全局光照 (RTXGI) 和 DLSS 3.5 等渲染技术的集合,可在游戏和应用中实现实时路径追踪。

NVIDIA公司新推出的一个技术产品,使动画人物的表现更加有个性并且更加像人,可以说这个技术就是使NPC中的角色栩栩如生,在游戏领域增加游戏沉浸感,并通过提供前沿的视觉效果和逼真的动画在数字人对话领域有更好的表现。

具体使用到的NVIDIA技术:

  • NVIDIA ACE 技术套件中的 NVIDIA Omniverse Audio2Face 为 NPC 的面部提供实时面部表情(面部动画)和口型同步,提供逼真的面部表情。

  • NVIDIA Riva 可实现精确的语音转换文字。

  • NVIDIA Animation graph 应用于骨骼动画合成、回放和控制的一个 runtime 框架。其实这就是一个制作动画人物的一个引擎软件,制作好的动画人物是可以具有一定动作的。

  • 大语言模型,根据预先给定的上下文(完整的背景)、知识库和不同的对话风格进行语言对话。

总结来说,就是使用“Animation graph”制作出一个动画人物,并用“大语言模型”赋予其语言对话的能力,然后使用“NVIDIA Riva”对游戏参与者(打游戏的人)的麦克风输入的语音转换为文字输入给大语言模型并且将大语言模型的语言回复转为声音外放输出,在和动画人物交互的同时“Audio2Face”会根据对话的语音提供实时的面部表情和口型,总的目标就是让数字人可以更加的逼真。


给出一个NVIDIA技术之上构建的一个数字人对话的产品:

https://www.digitalhumans.com/

感觉这个技术确实比之前的那种特别僵硬的“数字人”要好很多,说话的口型也感觉更加的自然,但是总的感觉还是和真人有一定的距离,现在的这个水平感觉和普通动漫电影中的人物表现有些像(甚至要强一些),但是依然没有3D大电影(如:阿凡达,等等)中的数字人那么逼真,当然,和真实人类表现的距离就更远了。

PS. 真理的数字人完全是电脑生成的,动漫的数字人需要人类手动去画细节表现,3D大电影中的人物往往需要真实的人在绿幕前面戴着传感器进行真实的动作表现后采集数据再转为数字人,所以从这个角度来说,这个数字人的表现已经是很不错的,从这个提高生动性的这个目的来看也是可以做到的。

数字人 —— 虚拟人 —— Inworld AI用生成式AI——生成式游戏NPC的更多相关文章

  1. 百度生成式AI产品文心一言邀你体验AI创作新奇迹:百度CEO李彦宏详细透露三大产业将会带来机遇(文末附文心一言个人用户体验测试邀请码获取方法,亲测有效)

    目录 中国版ChatGPT上线发布 强大中文理解能力 智能文学创作.商业文案创作 图片.视频智能生成 中国生成式AI三大产业机会 新型云计算公司 行业模型精调公司 应用服务提供商 总结 获取文心一言邀 ...

  2. 生成式AI会成为是人工智能的未来吗

    生成式 AI 是一项创新技术,可帮助算法人员生成以前依赖于业务员的模型,提供创造性的结果,而不会因业务员思想和经验而产生任何差错. 人工智能中的这项新技术确定了输入的原始模型,以生成演示训练数据特征. ...

  3. 生成式AI对业务流程有哪些影响?企业如何应用生成式AI?一文看懂

    集成与融合类ChatGPT工具与技术,以生成式AI变革业务流程 ChatGPT背后的生成式AI,聊聊生成式AI如何改变业务流程 ChatGPT月活用户过亿,生成式AI对组织的业务流程有哪些影响? 生成 ...

  4. 乘风破浪,遇见未来元宇宙(Metaverse)之进入元宇宙世界,虚拟数字人行业洞察报告

    正值元宇宙热潮,虚拟数字人兴起 作为⼀个新兴领域,虚拟数字⼈已经引起市场和资本的⾼度关注,截⾄目前据不完全统计,全球范围已有500+虚拟数字人相关项目获得融资,融资总额超10亿美元,并且融资项目和总额 ...

  5. Python 函数递归-三元表达式-列表生成式-字典生成式-匿名函数-内置函数

    上节课复习: 1. 无参装饰器 def 装饰器名字(func): def wrapper(*args,**kwargs): res = func(*args,**kwargs) return res ...

  6. Python 列表生成式 & 字典生成式

    Python 列表生成式 & 字典生成式 通过生成式可以更加简洁地生成列表和字典 列表生成式 对比 直接生成数据后加入列表示例: user_list = list() for i in ran ...

  7. AI 判别式模型和生成式模型

    判别式模型(discriminative model) 生成式模型(generative model) 对于输入x,类别标签y:产生式模型估计它们的联合概率分布P(x,y)判别式模型估计条件概率分布P ...

  8. 24分钟让AI跑起飞车类游戏

    本文由云+社区发表 作者:WeTest小编 WeTest 导读 本文主要介绍如何让AI在24分钟内学会玩飞车类游戏.我们使用Distributed PPO训练AI,在短时间内可以取得不错的训练效果. ...

  9. 从服务器角度分析RPG游戏——NPC的AI

    最近主程有些忙,甩给我一些服务器的代码,零零散散总结了一些要素. java程序架构也是层层分析,先罗列出需要做的工作,然后从主干到细节依次实现.就这点而言,程序和绘画有很多类似的地方. 关于怪物AI类 ...

  10. Excel催化剂开源第25波-Excel调用百度AI,返回AI结果

    现成的这些轮子,无需调用网页,直接本地离线即可生成). 当然在AI时代,少不了各种AI接口的使用场景,普通开发者只需聚焦在自己的业务场景上,这些AI底层技术,只需类似水煤电一般去BAT这些大厂那里去消 ...

随机推荐

  1. C# .NET Dictionary 将集合key以ascii码从小到大排序

    .NET 不加参数,默认不是按ASC II 排序 .JAVA 默认是按ASC II 排序 . Array.Sort(arrKeys, string.CompareOrdinal); 按ASC II 排 ...

  2. 使用 eBPF 在云中实现网络可观测性

    可观测性是一种了解和解释应用当前状态的能力,也是一种知道何时出现问题的方法.随着在 Kubernetes 和 OpenShift 上以微服务形式进行云部署的应用程序越来越多,可观察性受到了广泛关注.许 ...

  3. 安装tesserocr

    1.下载安装包 这个包不能使用pip安装 可以在这里找到适合自己的版本安装: https://github.com/simonflueckiger/tesserocr-windows_build/re ...

  4. USB OTG有关协议

    想了解USB OTG的工作原理,需要知道三个协议: ADP:Attach Detection Protocol HNP:Host Negotiation Protocol SRP:Session Re ...

  5. Linux驱动中的异步函数(aio_read和aio_write)

    Linux驱动中的异步函数(aio_read和aio_write) 我们可以在signal_handler使用了read和write函数处理设备文件的读写操作.然而这两个函数可以分别用aio_read ...

  6. Linux查看系统占用

    ## 查看内存占用 #CPU占用最多的前10个进程: ps auxw|head -1;ps auxw|sort -rn -k3|head -10 #内存消耗最多的前10个进程 ps auxw|head ...

  7. B 站和小红书又又又崩了,罪魁祸首竟然又是他。。。

    大家好,我是凌晨. 今天上午10点左右,我打开B站发现无法刷新视频列表和评论区,收藏夹和弹幕也均不可用. 原以为是手机网络问题,换网络重启手机都还是不行,第一时间打开微博,果然,B站崩了的新闻荣登榜首 ...

  8. sqlCel查询一个表中部分字段的数据后插入到另一个表中

    问题: 部门每天需要从后台系统将物流总表数据导出,Excel中整理出订单的物流发货渠道和发货时间,再手动导入到数据库中,整个过程不麻烦,但在Excel中比较繁琐. 需求: 将这个繁琐的过程变得更简单, ...

  9. vue-router 路由模式有几种?

    实际上存在三种模式: Hash:      使用URL的hash值来作为路由.支持所有浏览器. History:   以来HTML5 History API 和服务器配置.参考官网中HTML5 His ...

  10. 如何让 3D 数字孪生场景闪闪发光

    今日图扑软件功能分享:我们将探讨 HT 系统如何通过分组管理灯光.裁切体和流光,以提高场景光影效果的精准度和整体可控性. HT 中的灯光.裁切体.流光是会影响它所在区域一定范围内的其他节点的表现,如 ...