GPU Skinning 与 Instance

蒙皮动画

计算骨骼信息

蒙皮

GPU Skinning

CPU Skinning 与 GPU Skinning 实现方式

Skinning 类型 优点
CPU Skinning 各平台相似稳定
无 CPU/GPU 传输损耗
---- ----
GPU Skinning 多核并行计算
访存速度更快
浮点运算能力更高

Unity GPU Skinning 与 自定义 GPU Skinning 实现方式

目前 Unity 拥有一套 GPU Skinning 的流程,通过勾选 Project Setting 中的 GPU Skinning 选项即可。在 GPU 要支持 Texture Float 格式( Sample2D_float )下,通过 Skinning Mesh Renderer 进行 Transform feedback 结合 Geometry Shader 对 Vertex Buffer 重写来实现。

Skinning 类型 优点
Unity GPU Skinning 需要 OpenGL ES 3.0
CPU 计算骨骼信息
GPU 蒙皮
支持 Unity 原生工具链
---- ----
自定义 GPU Skinning 需要 OpenGL ES 2.0
不需要计算骨骼信息
GPU 蒙皮

自定义 GPU Skinning

总的来说,GPU Skinning 分成两部分:

  • 第一部分通过离线采样过程,把对应骨骼信息和动画矩阵烘焙在一张 Texture 上

  • 第二部分通过运行蒙皮过程,通过 Shader 实时计算顶点坐标。

(1)离线采样过程

GPU Skinning Sampler

  • Animation
  • Mesh
  • Material
  • Texture


其中 GPU Skinning Animation 数据比较复杂,包含骨骼信息和动画矩阵。

仔细观察,之前介绍 Texture 上已经存在骨骼信息和动画矩阵,这里 Animation 包括多余动画矩阵数据,主要是为了实现在 CPU 端获取骨骼点实时位置,用于实现类似特效挂点之类。

(2)运行蒙皮过程


在 GPU 端获取当前动画帧和 Texture 上的动画矩阵来计算顶点坐标。



GPU Instance

使用少量 DrawCall 一次性绘制大量相同 Mesh 且具有不同参数的对象。

DrawMesh 与 DrawMeshInstanced 实现方式

Instance 接口 优点
DrawMesh 简单
---- ----
DrawMeshInstanced 材质改变时候可以合批
深度排序时候可以合批
一次最多绘制 1023 个

MaterialPropertyBlock

MaterialPropertyBlock 相对于修改 Material.SetXXX 性能更优,并通过避免调用 Renderer.material 导致产生新 Material,从而节省内存。

  • 针对 [Per-Renderer-Data]
  • 性能较好
  • 新的 DrawCall

UWA https://blog.uwa4d.com/archives/1983.html

Shader

实现 Instance 通常需要三个步骤:

  • 定义数据缓冲区

UNITY_INSTANCING_BUFFER_START(name)

UNITY_DEFINE_INSTANCED_PROP(float4, _Property)

UNITY_INSTANCING_BUFFER_END(name)

  • 定义 SV_InstanceID

UNITY_VERTEX_INPUT_INSTANCE_ID

UNITY_SETUP_INSTANCE_ID(v)

  • 根据 ID 访问缓冲区数据

UNITY_ACCESS_INSTANCED_PROP(name, property)

GPU Skinning 结合 Instanced 高效实现大量单位动画的更多相关文章

  1. GPU Skinning不生效问题

    1)GPU Skinning不生效问题2)勾选凸包报的警告问题3)Unity 2019 图片压缩格式选择4)Android Export打包对压缩的影响5)Android内存中的Unknown部分泄漏 ...

  2. CSS动画与GPU

    写在前面 满世界的动画性能优化技巧,例如: 只允许改变transform.opacity,其它属性不要动,避免重新计算布局(reflow) 对动画元素应用transform: translate3d( ...

  3. U3D GPU蒙皮

    在U3D中默认情况下是使用CPU蒙皮的,在BUILDING SETTING中的others中可以设置为GPU skinning

  4. CPU与GPU,我们应该使用哪个?

    CPU与GPU,我们应该使用哪个? CPU与GPU CPU即中央处理器,GPU即图形处理器. 两者的相同之处:两者都有总线和外界联系,有自己的缓存体系,以及数字和逻辑运算单元 两者的区别之处:在于存在 ...

  5. 利用GPU实现大规模动画角色的渲染

    0x00 前言 我想很多开发游戏的小伙伴都希望自己的场景内能渲染越多物体越好,甚至是能同时渲染成千上万个有自己动作的游戏角色就更好了. 但不幸的是,渲染和管理大量的游戏对象是以牺牲CPU和GPU性能为 ...

  6. 利用GPU实现大规模动画角色的渲染(转)

    原文: https://www.cnblogs.com/murongxiaopifu/p/7250772.html 利用GPU实现大规模动画角色的渲染 0x00 前言 我想很多开发游戏的小伙伴都希望自 ...

  7. 3D网页小实验-基于多线程和精灵动画实现RTS式单位行为

    一.实验目的: 1.在上一篇的"RTS式单位控制"的基础上添加逻辑线程,为每个单位实现ai计算: 2.用精灵动画为单位的行为显示对应的动作效果. 二.运行效果: 1.场景中的单位分 ...

  8. 剖析虚幻渲染体系(15)- XR专题

    目录 15.1 本篇概述 15.1.1 本篇内容 15.1.2 XR概念 15.1.2.1 VR 15.1.2.2 AR 15.1.2.3 MR 15.1.2.4 XR 15.1.3 XR综述 15. ...

  9. FPS手游如何脱颖而出?看《CF手游》的性能突破之路

    WeTest导读 俗话说:用户体验不谈性能就是耍流氓. 在PC游戏上的性能问题并没有那么明显, 加个内存换个CPU或者刷个主频就能轻松搞定:到了手游时代后情况则显得比较严峻,捉襟见肘的内存使得资源加载 ...

随机推荐

  1. jquery动画函数里面可以跟一个回调函数,表示动画结束后执行的代码

    jquery动画函数里面可以跟一个回调函数,表示动画结束后执行的代码 使用js监听动画结束后进行的操作: $ele.fadeIn(300,function(){...}) $ele.fadeOut(3 ...

  2. php MySQL 选择数据库

    在你连接到 MySQL 数据库后,可能有多个可以操作的数据库,所以你需要选择你要操作的数据库. 从命令提示窗口中选择MySQL数据库 在 mysql> 提示窗口中可以很简单的选择特定的数据库.你 ...

  3. vue文件夹上传源码

    一. 功能性需求与非功能性需求 要求操作便利,一次选择多个文件和文件夹进行上传:支持PC端全平台操作系统,Windows,Linux,Mac 支持文件和文件夹的批量下载,断点续传.刷新页面后继续传输. ...

  4. js2py

    js2py

  5. PHP 连接本地mysql

    <?php echo microtime(true); ?> <?php $servername = "localhost"; $username = " ...

  6. c++ ros 计算两点距离

    #include <iostream> /* puts, printf */ #include <time.h> /* time_t, struct tm, time, loc ...

  7. Pyhton3异常处理

    例: while True:        try:            x = int(input("Please enter a number: "))            ...

  8. 缓冲区 cin() getline() getchar()

    ; } 只输入了一行abc, 然后回车后就输出一行abc, 一行空 这是因为cin在缓冲区里丢下的\n 给后面的getline()当成输入结束的标志了 二.getline(cin, str) 输入结束 ...

  9. Flask上下文源码分析(二)

    前面第一篇主要记录了Flask框架,从http请求发起,到返回响应,发生在server和app直接的过程. 里面有说到,Flask框架有设计了两种上下文,即应用上下文和请求上下文 官方文档里是说先理解 ...

  10. java集合类型源码解析之PriorityQueue

    本来第二篇想解析一下LinkedList,不过扫了一下源码后,觉得LinkedList的实现比较简单,没有什么意思,于是移步PriorityQueue. PriorityQueue通过数组实现了一个堆 ...