相关:

https://www.zhihu.com/zvideo/1548363713740226561

建议参看:

https://www.aiwht.com/sites/3406.html

https://baijiahao.baidu.com/s?id=1740770550462318916

亲自测试了一下,效果不错,不使用AI模式的情况下3D模型可以根据语音的变化调整口型,这个口型不像是根据声音波动大小进行调整的,感觉也是根据语音中的文字发言特点对的口型,可以说这个对口型还是不错的,比那种简单机械的上下动嘴唇的强太多了;至于这个口型对的是否正确这里没法验证,至少从不会唇语的人的角度来看,这个口型对的还是蛮不错的。这个软件除了给3D人脸模型对口型以外另一个功能就是可以设置面部表情,你可以人为的为某个画面帧设置表情(可以是angry,可以是fear,等等),也可以将整个语音的对应表情设置为AI模型的自动调整,目测这个表情部分或许还没有真人的表现那么好,不过从现有的3D模型的手动调整的方法来看还是要好不少的,估计目前比这个模型好的也就只有真人脸上贴感应器那种实时建模的方式了,从效果和实用性上来看这个软件是可以配的上NVIDIA的主打软件之一的这个地位的。

这个软件的应用场景就是3D建模的人脸,如下图:

对口型部分:

有上下嘴唇的动作控制,也有嘴部附近的肌肉控制,具体的3D控制点需要看3D模型中的关节点的设置。

面部表情控制部分:

控制的有眼睛和嘴部以上的肌肉,尤其是两侧脸颊处的肌肉,控制起来还是比较生动的。

面部表情调整为angry系数1.0,也就是angry表情加满,效果如下:

重点:

神奇的发现,如果是只对口型那么嘴的上方都是不动的,包括眼睛和嘴的以上的肌肉,但是如果选择面部表现,那么整个脸的肌肉(嘴部以上及以下肌肉),包括眼睛和鼻子都是会发生变化的,尤其是嘴部周围的肌肉和两个眉毛处肌肉以及下巴的动作变化尤为明显。

不过这个软件看上去主要的贡献是搞出了面部表情的自动3D脸部表情控制,其实这部分的工作其实难度有限,这个软件的真正核心的地方是这个表情状态的AI识别模型,也就是说根据表情的属性(angry还是fear)来控制3D模型的模版其实不是重点,重点是如何根据这个语音输入判断出当下时刻的表情属性,即当前时刻下表情的angry、fear、disgust等等的系数值(0.0~1.0)。

NVIDIA Omniverse Audio2Face的简介的更多相关文章

  1. 3DPytorch-API NVIDIA Kaolin

    3DPytorch-API NVIDIA Kaolin NVIDIA Kaolin library provides a PyTorch API for working with a variety ...

  2. AI 制作 3D 素材|基于 AI 5 天创建一个农场游戏,第 3 天

    欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏.到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中.本文将向您展示如何将 A ...

  3. NVIDIA GPU架构与原理分析(一)——GPU简介与主流Fermi、Kepler架构GPU概述

    1 GPU简介 图形处理单元GPU英文全称Graphic Processing Unit,GPU是相对于CPU的一个概念,NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GP ...

  4. ubuntu14.04+nvidia driver+cuda8+cudnn5+tensorflow0.12

    文章在简书里面编辑的,复制过来貌似不太好看,还是到简书的页面看吧: http://www.jianshu.com/p/c89b97d052b7 1.安装环境简介: 硬件: cpu:i7 6700k g ...

  5. 使用 Bumblebee 控制 NVIDIA 双显卡

    简介 Nvidia的双显卡切换技术叫Optimus(擎天柱),可惜只能在win7.vista下实现.Linux下没有对应的技术,当然苹果也没有.这导致独立显卡一直在启用,显卡发热升温,风扇狂转,却没有 ...

  6. CUDA ---- 简介

    CUDA简介 CUDA是并行计算的平台和类C编程模型,我们能很容易的实现并行算法,就像写C代码一样.只要配备的NVIDIA GPU,就可以在许多设备上运行你的并行程序,无论是台式机.笔记本抑或平板电脑 ...

  7. Android多媒体开发-- OpenMax IL简介

    1.openmax 简介 http://www.khronos.org/openmax/ OpenMax是一个多媒体应用程序的框架标准,由NVIDIA公司和Khronos在2006年推出. OpenM ...

  8. GPA简介

    GPA(Graphics Performance Analyzers)是Intel公司提供的一款免费的跨平台性能分析工具. 填写e-mail.name和country并提交后,就会收到一封有专属下载链 ...

  9. python 全栈开发,Day66(web应用,http协议简介,web框架)

    一.web应用 web应用程序是一种可以通过Web访问的应用程序,程序的最大好处是用户很容易访问应用程序,用户只需要有浏览器即可,不需要再安装其他软件.应用程序有两种模式C/S.B/S.C/S是客户端 ...

  10. Linux 内核引导选项简介

    Linux 内核引导选项简介 作者:金步国 连接地址:http://www.jinbuguo.com/kernel/boot_parameters.html 参考参数:https://www.cnbl ...

随机推荐

  1. LeetCode 72. Edit Distance 编辑距离 (C++/Java)

    题目: Given two words word1 and word2, find the minimum number of operations required to convert word1 ...

  2. 使用final shell 连接使用 ubuntu server linux

    书接上回,VM 安装ubuntu server:https://www.cnblogs.com/runliuv/p/16880599.html 1.从 https://www.hostbuf.com/ ...

  3. ftl生成模板并从前台下载

    1.生成模板的工具类 package com.jesims.busfundcallnew.util; import freemarker.template.Configuration; import ...

  4. 技术解密Java Chassis 3超实用的可观测性

    本文分享自华为云社区<Java Chassis 3技术解密:实用的可观测性>,作者:liubao68. 狭义的可观测性,指日志.调用链和指标,广义的可观测性则包含更多的内容,一般的,应用程 ...

  5. Linux设备模型:3、Uevent

    作者:wowo 发布于:2014-3-10 20:39 分类:统一设备模型 http://www.wowotech.net/device_model/uevent.html Uevent Uevent ...

  6. HTTP协议 学习:1-报文分析

    HTTP协议 学习:1-报文分析 背景 上一讲我们介绍了HTTP协议的一些 概念 ,对HTTP协议有了一个基础的认识. 正如之前学习MQTT协议一样,我们需要对HTTP的报文进行分析. HTTP 报文 ...

  7. Spring Cloud 比较

    Spring Cloud 比较 一.简介 1.SpringCloud:一套微服务架构下的一站式解决方案,理念就是解决我们在微服务架构中遇到的任何问题: 2.SpringCloudAlibaba:阿里实 ...

  8. Java常见问题-基础

    JDK版本新特性: JDK1.4 正则表达式,异常链,NIO,日志类,XML解析器,XLST转换器 JDK1.5 自动装箱.泛型.动态注解.枚举.可变长参数.遍历循环 JDK1.6 提供动态语言支持. ...

  9. position的值, relative和absolute分别是相对于谁进行定位的?

    relative:  相对定位,相对于自己本身在正常文档流中的位置进行定位 相对它原来的位置,在走100px.原来在标准流中的位置继续占有. absolute: 生成绝对定位,相对于最近一级定位不为s ...

  10. input标签 只能输入纯数字

    <input type="number" pattern="number" onkeyup="value=value.replace(/[^\d ...