GPU Skinning 与 Instance

蒙皮动画

计算骨骼信息

蒙皮

GPU Skinning

CPU Skinning 与 GPU Skinning 实现方式

Skinning 类型 优点
CPU Skinning 各平台相似稳定
无 CPU/GPU 传输损耗
---- ----
GPU Skinning 多核并行计算
访存速度更快
浮点运算能力更高

Unity GPU Skinning 与 自定义 GPU Skinning 实现方式

目前 Unity 拥有一套 GPU Skinning 的流程,通过勾选 Project Setting 中的 GPU Skinning 选项即可。在 GPU 要支持 Texture Float 格式( Sample2D_float )下,通过 Skinning Mesh Renderer 进行 Transform feedback 结合 Geometry Shader 对 Vertex Buffer 重写来实现。

Skinning 类型 优点
Unity GPU Skinning 需要 OpenGL ES 3.0
CPU 计算骨骼信息
GPU 蒙皮
支持 Unity 原生工具链
---- ----
自定义 GPU Skinning 需要 OpenGL ES 2.0
不需要计算骨骼信息
GPU 蒙皮

自定义 GPU Skinning

总的来说,GPU Skinning 分成两部分:

  • 第一部分通过离线采样过程,把对应骨骼信息和动画矩阵烘焙在一张 Texture 上

  • 第二部分通过运行蒙皮过程,通过 Shader 实时计算顶点坐标。

(1)离线采样过程

GPU Skinning Sampler

  • Animation
  • Mesh
  • Material
  • Texture


其中 GPU Skinning Animation 数据比较复杂,包含骨骼信息和动画矩阵。

仔细观察,之前介绍 Texture 上已经存在骨骼信息和动画矩阵,这里 Animation 包括多余动画矩阵数据,主要是为了实现在 CPU 端获取骨骼点实时位置,用于实现类似特效挂点之类。

(2)运行蒙皮过程


在 GPU 端获取当前动画帧和 Texture 上的动画矩阵来计算顶点坐标。



GPU Instance

使用少量 DrawCall 一次性绘制大量相同 Mesh 且具有不同参数的对象。

DrawMesh 与 DrawMeshInstanced 实现方式

Instance 接口 优点
DrawMesh 简单
---- ----
DrawMeshInstanced 材质改变时候可以合批
深度排序时候可以合批
一次最多绘制 1023 个

MaterialPropertyBlock

MaterialPropertyBlock 相对于修改 Material.SetXXX 性能更优,并通过避免调用 Renderer.material 导致产生新 Material,从而节省内存。

  • 针对 [Per-Renderer-Data]
  • 性能较好
  • 新的 DrawCall

UWA https://blog.uwa4d.com/archives/1983.html

Shader

实现 Instance 通常需要三个步骤:

  • 定义数据缓冲区

UNITY_INSTANCING_BUFFER_START(name)

UNITY_DEFINE_INSTANCED_PROP(float4, _Property)

UNITY_INSTANCING_BUFFER_END(name)

  • 定义 SV_InstanceID

UNITY_VERTEX_INPUT_INSTANCE_ID

UNITY_SETUP_INSTANCE_ID(v)

  • 根据 ID 访问缓冲区数据

UNITY_ACCESS_INSTANCED_PROP(name, property)

GPU Skinning 结合 Instanced 高效实现大量单位动画的更多相关文章

  1. GPU Skinning不生效问题

    1)GPU Skinning不生效问题2)勾选凸包报的警告问题3)Unity 2019 图片压缩格式选择4)Android Export打包对压缩的影响5)Android内存中的Unknown部分泄漏 ...

  2. CSS动画与GPU

    写在前面 满世界的动画性能优化技巧,例如: 只允许改变transform.opacity,其它属性不要动,避免重新计算布局(reflow) 对动画元素应用transform: translate3d( ...

  3. U3D GPU蒙皮

    在U3D中默认情况下是使用CPU蒙皮的,在BUILDING SETTING中的others中可以设置为GPU skinning

  4. CPU与GPU,我们应该使用哪个?

    CPU与GPU,我们应该使用哪个? CPU与GPU CPU即中央处理器,GPU即图形处理器. 两者的相同之处:两者都有总线和外界联系,有自己的缓存体系,以及数字和逻辑运算单元 两者的区别之处:在于存在 ...

  5. 利用GPU实现大规模动画角色的渲染

    0x00 前言 我想很多开发游戏的小伙伴都希望自己的场景内能渲染越多物体越好,甚至是能同时渲染成千上万个有自己动作的游戏角色就更好了. 但不幸的是,渲染和管理大量的游戏对象是以牺牲CPU和GPU性能为 ...

  6. 利用GPU实现大规模动画角色的渲染(转)

    原文: https://www.cnblogs.com/murongxiaopifu/p/7250772.html 利用GPU实现大规模动画角色的渲染 0x00 前言 我想很多开发游戏的小伙伴都希望自 ...

  7. 3D网页小实验-基于多线程和精灵动画实现RTS式单位行为

    一.实验目的: 1.在上一篇的"RTS式单位控制"的基础上添加逻辑线程,为每个单位实现ai计算: 2.用精灵动画为单位的行为显示对应的动作效果. 二.运行效果: 1.场景中的单位分 ...

  8. 剖析虚幻渲染体系(15)- XR专题

    目录 15.1 本篇概述 15.1.1 本篇内容 15.1.2 XR概念 15.1.2.1 VR 15.1.2.2 AR 15.1.2.3 MR 15.1.2.4 XR 15.1.3 XR综述 15. ...

  9. FPS手游如何脱颖而出?看《CF手游》的性能突破之路

    WeTest导读 俗话说:用户体验不谈性能就是耍流氓. 在PC游戏上的性能问题并没有那么明显, 加个内存换个CPU或者刷个主频就能轻松搞定:到了手游时代后情况则显得比较严峻,捉襟见肘的内存使得资源加载 ...

随机推荐

  1. 067_查看 KVM 虚拟机中的网卡信息(不需要进入启动或进入虚拟机)

    #!/bin/bash #该脚本使用 guestmount 工具,可以将虚拟机的磁盘系统挂载到真实机文件系统中#Centos7.2 中安装 libguestfs-tools-c 可以获得 guestm ...

  2. python 列表 【基本使用功能】

    #!/usr/bin/python # -*- coding: UTF-8 -*- # by Mercury_Lc list1 = list # 开个新的列表的方法 list2 = [] list1 ...

  3. xshel链接linuxl安装nginx

    原文链接:https://blog.csdn.net/Sweet__dream/article/details/78256952?utm_source=blogxgwz9 这个连接更详细:https: ...

  4. 10月清北学堂培训 Day 1

    今天是杨溢鑫老师的讲授~ T1 1 题意: n * m 的地图,有 4 种不同的地形(包括空地),6 种不同的指令,求从起点及初始的状态开始根据指令行动的结果. 2 思路:(虽然分了数据范围但是实际上 ...

  5. delphi 解决android 9上无法使用http协议

    delphi 解决android 9上无法使用http协议 安卓9不让客户端通过非https方式访问服务端数据(不允许发送明文http请求)的问题. 解决方法: 1.选择安卓平台编译一次程序,在项目根 ...

  6. 调用微信公众平台扫一扫示例及解决接口报错 { "errMsg": "config:invalid signature" }

    一.解决报错问题 单从报错信息 invalid signature 就可以看出是 签名signature 有问题, 查了很多资料,终于知道了问题点, 后台让我直接调接口是不对的,签名是根据请求接口的页 ...

  7. openrstry 限流 是否有清零逻辑

    openrstry  限流  是否有清零逻辑 https://github.com/openresty/lua-resty-limit-traffic

  8. sql中union,union all没有兼顾到的内容

    今日遇到一个问题,两张表联合取交集去重,但是需要把某一字段相同的也给去掉 union all : 联合,没有取交集 union :联合取交集(仅针对所有字段相同的去重) 解决方案:将联合的数据作为一个 ...

  9. ISO/IEC 9899:2011 条款6.2.3——标识符的名字空间

    6.2.3 标识符的名字空间 1.如果一个特定标识符的多个声明在一个翻译单元的任意一点可见,那么语法上下文会区分对不同实体的引用.从而,对于标识符各种不同的类别具有独立的名字空间: ——标签名(通过标 ...

  10. 深度学习框架PyTorch一书的学习-第七章-生成对抗网络(GAN)

    参考:https://github.com/chenyuntc/pytorch-book/tree/v1.0/chapter7-GAN生成动漫头像 GAN解决了非监督学习中的著名问题:给定一批样本,训 ...