相关:

https://www.zhihu.com/zvideo/1548363713740226561

建议参看:

https://www.aiwht.com/sites/3406.html

https://baijiahao.baidu.com/s?id=1740770550462318916

亲自测试了一下,效果不错,不使用AI模式的情况下3D模型可以根据语音的变化调整口型,这个口型不像是根据声音波动大小进行调整的,感觉也是根据语音中的文字发言特点对的口型,可以说这个对口型还是不错的,比那种简单机械的上下动嘴唇的强太多了;至于这个口型对的是否正确这里没法验证,至少从不会唇语的人的角度来看,这个口型对的还是蛮不错的。这个软件除了给3D人脸模型对口型以外另一个功能就是可以设置面部表情,你可以人为的为某个画面帧设置表情(可以是angry,可以是fear,等等),也可以将整个语音的对应表情设置为AI模型的自动调整,目测这个表情部分或许还没有真人的表现那么好,不过从现有的3D模型的手动调整的方法来看还是要好不少的,估计目前比这个模型好的也就只有真人脸上贴感应器那种实时建模的方式了,从效果和实用性上来看这个软件是可以配的上NVIDIA的主打软件之一的这个地位的。

这个软件的应用场景就是3D建模的人脸,如下图:

对口型部分:

有上下嘴唇的动作控制,也有嘴部附近的肌肉控制,具体的3D控制点需要看3D模型中的关节点的设置。

面部表情控制部分:

控制的有眼睛和嘴部以上的肌肉,尤其是两侧脸颊处的肌肉,控制起来还是比较生动的。

面部表情调整为angry系数1.0,也就是angry表情加满,效果如下:

重点:

神奇的发现,如果是只对口型那么嘴的上方都是不动的,包括眼睛和嘴的以上的肌肉,但是如果选择面部表现,那么整个脸的肌肉(嘴部以上及以下肌肉),包括眼睛和鼻子都是会发生变化的,尤其是嘴部周围的肌肉和两个眉毛处肌肉以及下巴的动作变化尤为明显。

不过这个软件看上去主要的贡献是搞出了面部表情的自动3D脸部表情控制,其实这部分的工作其实难度有限,这个软件的真正核心的地方是这个表情状态的AI识别模型,也就是说根据表情的属性(angry还是fear)来控制3D模型的模版其实不是重点,重点是如何根据这个语音输入判断出当下时刻的表情属性,即当前时刻下表情的angry、fear、disgust等等的系数值(0.0~1.0)。

NVIDIA Omniverse Audio2Face的简介的更多相关文章

  1. 3DPytorch-API NVIDIA Kaolin

    3DPytorch-API NVIDIA Kaolin NVIDIA Kaolin library provides a PyTorch API for working with a variety ...

  2. AI 制作 3D 素材|基于 AI 5 天创建一个农场游戏,第 3 天

    欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏.到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中.本文将向您展示如何将 A ...

  3. NVIDIA GPU架构与原理分析(一)——GPU简介与主流Fermi、Kepler架构GPU概述

    1 GPU简介 图形处理单元GPU英文全称Graphic Processing Unit,GPU是相对于CPU的一个概念,NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GP ...

  4. ubuntu14.04+nvidia driver+cuda8+cudnn5+tensorflow0.12

    文章在简书里面编辑的,复制过来貌似不太好看,还是到简书的页面看吧: http://www.jianshu.com/p/c89b97d052b7 1.安装环境简介: 硬件: cpu:i7 6700k g ...

  5. 使用 Bumblebee 控制 NVIDIA 双显卡

    简介 Nvidia的双显卡切换技术叫Optimus(擎天柱),可惜只能在win7.vista下实现.Linux下没有对应的技术,当然苹果也没有.这导致独立显卡一直在启用,显卡发热升温,风扇狂转,却没有 ...

  6. CUDA ---- 简介

    CUDA简介 CUDA是并行计算的平台和类C编程模型,我们能很容易的实现并行算法,就像写C代码一样.只要配备的NVIDIA GPU,就可以在许多设备上运行你的并行程序,无论是台式机.笔记本抑或平板电脑 ...

  7. Android多媒体开发-- OpenMax IL简介

    1.openmax 简介 http://www.khronos.org/openmax/ OpenMax是一个多媒体应用程序的框架标准,由NVIDIA公司和Khronos在2006年推出. OpenM ...

  8. GPA简介

    GPA(Graphics Performance Analyzers)是Intel公司提供的一款免费的跨平台性能分析工具. 填写e-mail.name和country并提交后,就会收到一封有专属下载链 ...

  9. python 全栈开发,Day66(web应用,http协议简介,web框架)

    一.web应用 web应用程序是一种可以通过Web访问的应用程序,程序的最大好处是用户很容易访问应用程序,用户只需要有浏览器即可,不需要再安装其他软件.应用程序有两种模式C/S.B/S.C/S是客户端 ...

  10. Linux 内核引导选项简介

    Linux 内核引导选项简介 作者:金步国 连接地址:http://www.jinbuguo.com/kernel/boot_parameters.html 参考参数:https://www.cnbl ...

随机推荐

  1. 面试官:谈谈对SpringAI的理解?

    Spring AI 已经发布了好长时间了,目前已经更新到 1.0 版本了,所以身为 Java 程序员的你,如果还对 Spring AI 一点都不了解的话,那就有点太落伍了. 言归正传,那什么是 Spr ...

  2. AgileConfig-1.9.4 发布,支持 OpenTelemetry

    Hello 大家好,最新版的 AgileConfig 1.9.4 发布了.现在它可以通过 OpenTelemetry 对外提供 logs,traces,metrics 三个维度的数据.用户可以自由选择 ...

  3. Postman 的 Basic Auth 如何通过 Feign 实现

    Postman 的 Basic Auth: 分析 根据以上图片分析: Postman 的 Authorization 实际为: header 中添加 Authorization: ******* ** ...

  4. 【VMware vSphere】使用RVTools中的PowerShell脚本创建导出vSphere环境信息的自动化任务。

    RVTools 是 VMware 生态系统中一个非常受欢迎且免费的 Windows 实用工具,用于收集并显示 VMware vSphere 环境中的相关信息,如虚拟机.主机及集群等相关配置.RVToo ...

  5. PAT-甲级-1007

    一.看题,https://www.patest.cn/contests/pat-a-practise/1007 其实,也是一顿暴力,但是最后一个测试点会运行超时,最开始,计算一段区间的值的总和的时候, ...

  6. 降维(三)LLE与其他降维技术

    LLE 局部线性嵌入,Locally Linear Embedding(LLE)是另一个功能强大的非线性降维(nonlinear dimensional reduction,NLDR)技术.它是一个流 ...

  7. TrustZone与高通

    改编自:https://blog.csdn.net/guyongqiangx/article/details/78020257 介绍 导读 Q:什么是Trust Zone A:Trust Zone:是 ...

  8. 我的 ZYNQ 系列总结

    我的 ZYNQ 系列总结 背景 ZYNQ平台是我接触认识比较久的平台,还算不错,是工控.音视频各行业都可以使用中高端平台. 本文以ZYNQ-7000为例,其实更高级的MPSOC也是一样的. 先看看我自 ...

  9. python基础-内置函数

    # callable() # 函数用于检查一个对象是否是可调用的.如果返回 True,object 仍然可能调用失败:但如果返回 False,调用对象 object 绝对不会成功. # 对于函数.方法 ...

  10. Exception in thread "main" java.lang.NoClassDefFoundError: io/netty/channel/EventLoopGroup

    最近在学习dubbo,跟着教程做,但是运行时报错,需要添加netty依赖 <dependency> <groupId>io.netty</groupId> < ...