NVIDIA Omniverse Audio2Face的简介
相关:
https://www.zhihu.com/zvideo/1548363713740226561
建议参看:
https://www.aiwht.com/sites/3406.html
https://baijiahao.baidu.com/s?id=1740770550462318916
亲自测试了一下,效果不错,不使用AI模式的情况下3D模型可以根据语音的变化调整口型,这个口型不像是根据声音波动大小进行调整的,感觉也是根据语音中的文字发言特点对的口型,可以说这个对口型还是不错的,比那种简单机械的上下动嘴唇的强太多了;至于这个口型对的是否正确这里没法验证,至少从不会唇语的人的角度来看,这个口型对的还是蛮不错的。这个软件除了给3D人脸模型对口型以外另一个功能就是可以设置面部表情,你可以人为的为某个画面帧设置表情(可以是angry,可以是fear,等等),也可以将整个语音的对应表情设置为AI模型的自动调整,目测这个表情部分或许还没有真人的表现那么好,不过从现有的3D模型的手动调整的方法来看还是要好不少的,估计目前比这个模型好的也就只有真人脸上贴感应器那种实时建模的方式了,从效果和实用性上来看这个软件是可以配的上NVIDIA的主打软件之一的这个地位的。
这个软件的应用场景就是3D建模的人脸,如下图:
对口型部分:
有上下嘴唇的动作控制,也有嘴部附近的肌肉控制,具体的3D控制点需要看3D模型中的关节点的设置。
面部表情控制部分:
控制的有眼睛和嘴部以上的肌肉,尤其是两侧脸颊处的肌肉,控制起来还是比较生动的。
面部表情调整为angry系数1.0,也就是angry表情加满,效果如下:
重点:
神奇的发现,如果是只对口型那么嘴的上方都是不动的,包括眼睛和嘴的以上的肌肉,但是如果选择面部表现,那么整个脸的肌肉(嘴部以上及以下肌肉),包括眼睛和鼻子都是会发生变化的,尤其是嘴部周围的肌肉和两个眉毛处肌肉以及下巴的动作变化尤为明显。
不过这个软件看上去主要的贡献是搞出了面部表情的自动3D脸部表情控制,其实这部分的工作其实难度有限,这个软件的真正核心的地方是这个表情状态的AI识别模型,也就是说根据表情的属性(angry还是fear)来控制3D模型的模版其实不是重点,重点是如何根据这个语音输入判断出当下时刻的表情属性,即当前时刻下表情的angry、fear、disgust等等的系数值(0.0~1.0)。
NVIDIA Omniverse Audio2Face的简介的更多相关文章
- 3DPytorch-API NVIDIA Kaolin
3DPytorch-API NVIDIA Kaolin NVIDIA Kaolin library provides a PyTorch API for working with a variety ...
- AI 制作 3D 素材|基于 AI 5 天创建一个农场游戏,第 3 天
欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏.到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中.本文将向您展示如何将 A ...
- NVIDIA GPU架构与原理分析(一)——GPU简介与主流Fermi、Kepler架构GPU概述
1 GPU简介 图形处理单元GPU英文全称Graphic Processing Unit,GPU是相对于CPU的一个概念,NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GP ...
- ubuntu14.04+nvidia driver+cuda8+cudnn5+tensorflow0.12
文章在简书里面编辑的,复制过来貌似不太好看,还是到简书的页面看吧: http://www.jianshu.com/p/c89b97d052b7 1.安装环境简介: 硬件: cpu:i7 6700k g ...
- 使用 Bumblebee 控制 NVIDIA 双显卡
简介 Nvidia的双显卡切换技术叫Optimus(擎天柱),可惜只能在win7.vista下实现.Linux下没有对应的技术,当然苹果也没有.这导致独立显卡一直在启用,显卡发热升温,风扇狂转,却没有 ...
- CUDA ---- 简介
CUDA简介 CUDA是并行计算的平台和类C编程模型,我们能很容易的实现并行算法,就像写C代码一样.只要配备的NVIDIA GPU,就可以在许多设备上运行你的并行程序,无论是台式机.笔记本抑或平板电脑 ...
- Android多媒体开发-- OpenMax IL简介
1.openmax 简介 http://www.khronos.org/openmax/ OpenMax是一个多媒体应用程序的框架标准,由NVIDIA公司和Khronos在2006年推出. OpenM ...
- GPA简介
GPA(Graphics Performance Analyzers)是Intel公司提供的一款免费的跨平台性能分析工具. 填写e-mail.name和country并提交后,就会收到一封有专属下载链 ...
- python 全栈开发,Day66(web应用,http协议简介,web框架)
一.web应用 web应用程序是一种可以通过Web访问的应用程序,程序的最大好处是用户很容易访问应用程序,用户只需要有浏览器即可,不需要再安装其他软件.应用程序有两种模式C/S.B/S.C/S是客户端 ...
- Linux 内核引导选项简介
Linux 内核引导选项简介 作者:金步国 连接地址:http://www.jinbuguo.com/kernel/boot_parameters.html 参考参数:https://www.cnbl ...
随机推荐
- 剑指Offer-65.矩阵中的路径(C++/Java)
题目: 请设计一个函数,用来判断在一个矩阵中是否存在一条包含某字符串所有字符的路径.路径可以从矩阵中的任意一个格子开始,每一步可以在矩阵中向左,向右,向上,向下移动一个格子.如果一条路径经过了矩阵中的 ...
- P7448
problem & 双倍经验 & blog 低配版本 没有 Ynoi 标志性算法卡常,这点差评. 拆解问题 定义 \(lst_i\) 为上一个和 \(i\) 号点相同的位置. 由于几个 ...
- Mybatis 动态 sql 是做什么的?都有哪些动态 sql?能简述一下动态 sql 的执行原理不?
a.Mybatis 动态 sql 可以让我们在 Xml 映射文件内,以标签的形式编写动态 sql,完成逻辑判断和动态拼接 sql 的功能. b.Mybatis 提 供 了 9 种 动 态 sql 标 ...
- JSON文件存储
JSON 文件存储 JSON,全称为 JavaScript Object Notation, 也就是 JavaScript 对象标记,通过对象和数组的组合来表示数据,构造简洁但是结构化程度非常高,是一 ...
- Latex 公式 如何转为Word 公式,免费线上网站
在实际中,我们常常需要讲将atex公式在word中书写.不采用手敲word公式,如何直接从Latex公式转word公式: 非常好的网站:https://www.latexlive.com/ 可以直接复 ...
- Linux 内核:GPIO子系统(1)软件框架
Linux 内核:GPIO子系统(1)软件框架 背景 在很多驱动开发中,GPIO用得很多,因此学习一下:也会顺便看看pinctrl 子系统. 原文(有删改):http://www.wowotech.n ...
- 【论文阅读】Causal Imitative Model for Autonomous Driving
Sensor/组织: EPFL Sharif University of Technology Status: Finished Summary: 看看框架图就行.高效缓解因果混淆问题,将因果作为学习 ...
- 【Hadoop报错】The directory item limit is exceeded: limit=1048576 items=1048576
问题描述: 调度系统执行hive任务失败,一直执行失败,报错如下: java.io.IOException: java.net.ConnectException: Call From #HostNam ...
- DarkHole_1靶机渗透流程
VulnHub_DarkHole1靶机渗透流程 注意:部署时,靶机的网络连接模式必须和kali一致,让靶机跟kali处于同一网段,这用kali才能扫出靶机的主机 1. 信息收集 1.1 探测IP 使用 ...
- 说说你对 SPA 单页面的理解,它的优缺点分别是什么?
SPA( single-page application )仅在 Web 页面初始化时加载相应的 HTML.JavaScript 和 CSS. 一旦页> 面加载完成,SPA 不会因为用户的操作而 ...