相关:

https://www.zhihu.com/zvideo/1548363713740226561

建议参看:

https://www.aiwht.com/sites/3406.html

https://baijiahao.baidu.com/s?id=1740770550462318916

亲自测试了一下,效果不错,不使用AI模式的情况下3D模型可以根据语音的变化调整口型,这个口型不像是根据声音波动大小进行调整的,感觉也是根据语音中的文字发言特点对的口型,可以说这个对口型还是不错的,比那种简单机械的上下动嘴唇的强太多了;至于这个口型对的是否正确这里没法验证,至少从不会唇语的人的角度来看,这个口型对的还是蛮不错的。这个软件除了给3D人脸模型对口型以外另一个功能就是可以设置面部表情,你可以人为的为某个画面帧设置表情(可以是angry,可以是fear,等等),也可以将整个语音的对应表情设置为AI模型的自动调整,目测这个表情部分或许还没有真人的表现那么好,不过从现有的3D模型的手动调整的方法来看还是要好不少的,估计目前比这个模型好的也就只有真人脸上贴感应器那种实时建模的方式了,从效果和实用性上来看这个软件是可以配的上NVIDIA的主打软件之一的这个地位的。

这个软件的应用场景就是3D建模的人脸,如下图:

对口型部分:

有上下嘴唇的动作控制,也有嘴部附近的肌肉控制,具体的3D控制点需要看3D模型中的关节点的设置。

面部表情控制部分:

控制的有眼睛和嘴部以上的肌肉,尤其是两侧脸颊处的肌肉,控制起来还是比较生动的。

面部表情调整为angry系数1.0,也就是angry表情加满,效果如下:

重点:

神奇的发现,如果是只对口型那么嘴的上方都是不动的,包括眼睛和嘴的以上的肌肉,但是如果选择面部表现,那么整个脸的肌肉(嘴部以上及以下肌肉),包括眼睛和鼻子都是会发生变化的,尤其是嘴部周围的肌肉和两个眉毛处肌肉以及下巴的动作变化尤为明显。

不过这个软件看上去主要的贡献是搞出了面部表情的自动3D脸部表情控制,其实这部分的工作其实难度有限,这个软件的真正核心的地方是这个表情状态的AI识别模型,也就是说根据表情的属性(angry还是fear)来控制3D模型的模版其实不是重点,重点是如何根据这个语音输入判断出当下时刻的表情属性,即当前时刻下表情的angry、fear、disgust等等的系数值(0.0~1.0)。

NVIDIA Omniverse Audio2Face的简介的更多相关文章

  1. 3DPytorch-API NVIDIA Kaolin

    3DPytorch-API NVIDIA Kaolin NVIDIA Kaolin library provides a PyTorch API for working with a variety ...

  2. AI 制作 3D 素材|基于 AI 5 天创建一个农场游戏,第 3 天

    欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏.到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中.本文将向您展示如何将 A ...

  3. NVIDIA GPU架构与原理分析(一)——GPU简介与主流Fermi、Kepler架构GPU概述

    1 GPU简介 图形处理单元GPU英文全称Graphic Processing Unit,GPU是相对于CPU的一个概念,NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GP ...

  4. ubuntu14.04+nvidia driver+cuda8+cudnn5+tensorflow0.12

    文章在简书里面编辑的,复制过来貌似不太好看,还是到简书的页面看吧: http://www.jianshu.com/p/c89b97d052b7 1.安装环境简介: 硬件: cpu:i7 6700k g ...

  5. 使用 Bumblebee 控制 NVIDIA 双显卡

    简介 Nvidia的双显卡切换技术叫Optimus(擎天柱),可惜只能在win7.vista下实现.Linux下没有对应的技术,当然苹果也没有.这导致独立显卡一直在启用,显卡发热升温,风扇狂转,却没有 ...

  6. CUDA ---- 简介

    CUDA简介 CUDA是并行计算的平台和类C编程模型,我们能很容易的实现并行算法,就像写C代码一样.只要配备的NVIDIA GPU,就可以在许多设备上运行你的并行程序,无论是台式机.笔记本抑或平板电脑 ...

  7. Android多媒体开发-- OpenMax IL简介

    1.openmax 简介 http://www.khronos.org/openmax/ OpenMax是一个多媒体应用程序的框架标准,由NVIDIA公司和Khronos在2006年推出. OpenM ...

  8. GPA简介

    GPA(Graphics Performance Analyzers)是Intel公司提供的一款免费的跨平台性能分析工具. 填写e-mail.name和country并提交后,就会收到一封有专属下载链 ...

  9. python 全栈开发,Day66(web应用,http协议简介,web框架)

    一.web应用 web应用程序是一种可以通过Web访问的应用程序,程序的最大好处是用户很容易访问应用程序,用户只需要有浏览器即可,不需要再安装其他软件.应用程序有两种模式C/S.B/S.C/S是客户端 ...

  10. Linux 内核引导选项简介

    Linux 内核引导选项简介 作者:金步国 连接地址:http://www.jinbuguo.com/kernel/boot_parameters.html 参考参数:https://www.cnbl ...

随机推荐

  1. Flashcat与出行科技企业一起实践多云可观测

    当前架构 某出行科技企业从单个公有云往多云转型,依托于国内领先的公有云提供商,采用多云架构,在可用性.弹性.成本.供应商依赖方面,拥有了显著的优势. 相应的,多云架构也给技术团队带来了一定的复杂度和技 ...

  2. JavaScript防抖与节流笔记

    JavaScript防抖与节流 概念 防抖(debounce)与节流(throttle)是两个相似但有本质区别的两个概念,但两个概念的存在都是为了控制在特定条件下函数最大的执行次数.这在例如将函数执行 ...

  3. 用CSS3绘制iPhone手机

    Tips:当你看到这个提示的时候,说明当前的文章是由原emlog博客系统搬迁至此的,文章发布时间已过于久远,编排和内容不一定完整,还请谅解` 用CSS3绘制iPhone手机 日期:2017-7-3 阿 ...

  4. 查看mongo的bson数据文件

    转载请注明出处: BSON(Binary Serialized Document Format)是MongoDB中用于存储和传输数据的一种二进制形式的存储格式,它基于JSON格式,但比JSON更松散, ...

  5. 「C++」复杂模拟【壹】

    建议开启目录食用 阅读本文之前建议您先看这里,如果您已经看完了,那么就可以放心大胆的学习本文了. 我认为其实本文的难度还是比较大的,今天我们题是来自山东省省选,所以建议大家谨慎阅读,如果您是专业程序员 ...

  6. airflow(二)集成EMR使用

    1. 准备工作 1.1. 安装并初始化airflow,参考以下文档: https://www.cnblogs.com/zackstang/p/11082322.html 其中还要额外安装的是: sud ...

  7. QT学习:08 QString

    --- title: framework-cpp-qt-08-QString EntryName: framework-cpp-qt-08-QString date: 2020-04-16 15:36 ...

  8. arm linux 移植 ffmpeg 库 + x264 + x265

    背景 Ffmpeg 中带有h264的解码,没有编码,需要添加x264.libx264是一个自由的H.264编码库,是x264项目的一部分,使用广泛,ffmpeg的H.264实现就是用的libx264. ...

  9. Vue Element-UI 按需引入提示Cannot find module 'babel-preset-es2015'

    1.我的开发环境和操作步骤 1.1.使用VUE-CLI创建  2.x 脚手架 1.2.安装 npm i element-ui(参照官网) 1.3.安装 npm install babel-plugin ...

  10. aach64架构 ubuntu20 桌面版 编译安装ffmpeg难点总结

    [编译安装x264] 这一步基本上没有难点 git clone https://gitee.com/mirrors/x264.git ./configure --enable-shared --ena ...