开发自定义ScriptableRenderPipeline,将DrawCall降低180倍
0x00 前言
大家都知道,Unity在2018版本中正式推出了Scriptable Render Pipeline。我们既可以通过Package Manager下载使用Unity预先创建好的LightWeight Render Pipeline和High Defination Render Pipeline,也可以自己动手创建自定义的Render Pipeline,实现一些符合自己心意的渲染策略。
下面我们先简单介绍一下自定义SRP的使用方法,之后利用自定义的Render Pipeline来优化一个常见的情景,即渲染半透时由于渲染顺序被打乱,从而导致的合批失败。
0x01 一个简单的SRP流水线实现
如何自定义一个Scriptable Render Pipeline,Unity有一篇博客[1]已经做了简单的介绍。
根据这篇博客,我们知道,首先要定义一个继承自UnityEngine.Experimental.Rendering.RenderPipeline的类,并且覆写其中的Render方法,在该方法中实现自己的渲染逻辑。
//定义渲染管线逻辑
using UnityEngine;
using UnityEngine.Rendering;
using UnityEngine.Experimental.Rendering;
public class BasicPipeInstance : RenderPipeline
{
private Color m_ClearColor = Color.black;
public BasicPipeInstance(Color clearColor)
{
m_ClearColor = clearColor;
}
public override void Render(ScriptableRenderContext context, Camera[] cameras)
{
// does not so much yet :()
base.Render(context, cameras);
// clear buffers to the configured color
var cmd = new CommandBuffer();
cmd.ClearRenderTarget(true, true, m_ClearColor);
context.ExecuteCommandBuffer(cmd);
cmd.Release();
context.Submit();
}
}
这个脚本的逻辑十分简单,即使用纯色来清屏。ScriptableRenderContext 类的实例context即当前的渲染上下文,保存了当前的渲染状态。
有了渲染管线的逻辑,之后我们要做的就是调用AssetDatabase.CreateAsset将这个渲染管线保存为一个Asset,储存在硬盘上,并将这个Asset赋值给Graphics Setting以激活该管线。
所以,我们接下来就需要一个能够被Unity创建出Asset并被序列化保存的类,在SRP中这个类叫做RenderPipelineAsset。
[ExecuteInEditMode]
//定义渲染管线Asset
public class BasicAssetPipe : RenderPipelineAsset
{
public Color clearColor = Color.blue;
protected override IRenderPipeline InternalCreatePipeline()
{
return new BasicPipeInstance(clearColor);
}
}
这样,我们就能很方便的创建出一个渲染管线的Asset,和传统的Scriptable Object一样,我们可以直接通过Asset来修改其字段的内容,这里我们只定义了一个名字是clearColor的字段。
当然,我们可以创建完Asset之后,再手动给Graphics Setting赋值,也可以直接在脚本中给Graphics Setting赋值,只需要访问GraphicsSettings.renderPipelineAsset即可。
using UnityEngine;
using UnityEditor;
using UnityEngine.Rendering;
public class MySRPCreate
{
[MenuItem("Assets/Create/MySRP")]
public static void CreateSRP()
{
var instance = ScriptableObject.CreateInstance<BasicAssetPipe>();
AssetDatabase.CreateAsset(instance, "Assets/MyScriptableRenderPipeline.asset");
GraphicsSettings.renderPipelineAsset = instance;
}
}
ok,打开相关的菜单,点击按钮,整个Unity的传统渲染管线就被替换成了我们刚刚自定义的渲染管线——简单的说,就是一个纯色清屏。
0x02 自定义管线,让DC从3700到20
OK,接下来我们来看一个有趣的场景。这个场景中,我们通过脚本来生成2种角色,每一种角色的数量有1500名——需要渲染的当然还包括她们的影子。为了尽量减少DrawCall的数量,自然会想到开启GPU Instance。
这个是Unity的默认渲染管线的渲染成果,可是打开Frame Debugger我们可以发现渲染的成本高的吓人,DrawCall数量达到了3700次左右——在打开了GPU Instance的情况下。
查看一下某次DrawCall的GPU Instance失败原因,是由于"Objects have different materials"。而查看相关的DrawCall数据,可以发现2种角色和阴影出现了交替渲染的情况,这样便导致了materials 不同造成的GPU Instance失败。
所以接下来我们要做的事情,就是能否自己来对这个场景内的对象进行渲染排序,因为我们希望的是角色和阴影的渲染不要交替出现,所以理想状态是先把所有的角色面片渲染出来,接下来再来渲染阴影。
在自定义渲染流水线中实际调用绘制指令时,我们还会遇到一些别的类型和方法。例如,我们需要先对场景进行裁剪,选出需要被渲染的对象。
在这里我们会遇到CullResults结构体,以及ScriptableCullingParameters结构体。通过这两个结构体以及它们所定义的方法,我们可以获取经过裁剪之后需要被渲染的对象以及灯光数据——分别保存在CullResults的visibleLights字段以及visibleRenderers字段中。
获取了visibleLights也就是光照信息之后,我们就可以为我们的管线设置光照数据了。
例如,我们把方向光的颜色传入到shader的LightColor0变量中,把方向光的方向传入到shader的WorldSpaceLightPos0变量中。
foreach( var visibleLight in visibleLights)
{
if (visibleLight.lightType == LightType.Directional)
{
Vector4 dir = -visibleLight.localToWorld.GetColumn(2) ;
Shader.SetGlobalVector(ShaderNameHash.LightColor0, visibleLight.finalColor);
Shader.SetGlobalVector(ShaderNameHash.WorldSpaceLightPos0, new Vector4(dir.x,dir.y,dir.z,0.0f) );
break;
}
}
而visibleRenderers中保存的则是需要被渲染的对象。涉及到对象的渲染,我们显然需要确定一些渲染设置,在自定义管线中保存这些设置的是DrawRendererSettings结构体。
一些常见的渲染设置,例如最常见的便是设置所使用的shader——更具体的说是使用的pass,这里Unity也对Shader的pass名字做了一个简单封装,即ShaderPassName结构体,它用来指定我们所使用的shader pass,正确设置后,Unity会在Renderer所使用的shader中寻找指定的pass。
除此之外,如果需要被渲染的对象不是一个,那么显然会涉及到一个排序的问题。同样我们也可以设置DrawRendererSettings结构体的sorting.flags来确定排序规则。可以设置的排序规则,可以查看这个文档:
https://docs.unity3d.com/ScriptReference/Experimental.Rendering.SortFlags.html
其中有一个叫做SortFlags.OptimizeStateChanges的规则,看上去这个很适合我们的需求,因为它的技能描述是:
Sort objects to reduce draw state changes.
此时visibleRenderers中包括的待渲染对象不仅有角色、还包括四周的墙体、以及角色脚下的阴影面片,所以为了达到先把所有的角色面片渲染出来,接下来再来渲染阴影的目的——也就是说为了规避所谓的穿插问题——我们接下来先把需要渲染的角色过滤出来。此时我们需要另一个结构体来实现过滤的需求——FilterRenderersSettings。FilterRenderersSettings可以按照待渲染对象所在的RenderQueue和layer来筛选真正需要被渲染的对象。
可以看到,角色的渲染队列设置的3000,也就是transparent。所以我们可以用RenderQueue来进行一次筛选,再使用layer筛选出角色——角色所在的layer叫做Chara。
Ok,到这里,我们就筛选出了需要被渲染的角色,并且设置好了角色的渲染状态。最后,我们直接调用Draw指令,并把这些设置作为参数传入Draw即可。
把以上的逻辑封装为一个方法,在Render中调用该方法就可以渲染出所有的角色了。
private void DrawCharacter(ScriptableRenderContext context, Camera camera, ShaderPassName pass,SortFlags sortFlags)
{
var settings = new DrawRendererSettings(camera, pass);
settings.sorting.flags = sortFlags;
var filterSettings = new FilterRenderersSettings(true)
{
renderQueueRange = RenderQueueRange.transparent,
layerMask = 1 << LayerDefine.CHARA
};
context.DrawRenderers(cull.visibleRenderers, ref settings, filterSettings);
}
这样,我们就渲染出了3000多个角色——在只用了8个DrawCall的情况下。
第一个小目标达成。
背景墙体,和阴影其实也大同小异,因为我们已经对可能产生穿插渲染的对象做出了区分,先全部渲染角色,再渲染阴影。重点在于分组渲染。渲染墙体、阴影面片的代码要做的也便是将墙体、阴影对象过滤出来,进行单独渲染。
private void DrawBg(ScriptableRenderContext context, Camera camera)
{
var settings = new DrawRendererSettings(camera, basicPass);
settings.sorting.flags = SortFlags.CommonOpaque;
var filterSettings = new FilterRenderersSettings(true)
{
renderQueueRange = RenderQueueRange.opaque,
layerMask = 1 << LayerDefine.BG
};
context.DrawRenderers(cull.visibleRenderers, ref settings, filterSettings);
}
private void DrawShadow(ScriptableRenderContext context, Camera camera)
{
var settings = new DrawRendererSettings(camera, basicPass);
settings.sorting.flags = SortFlags.CommonTransparent;
var filterSettings = new FilterRenderersSettings(true)
{
renderQueueRange = RenderQueueRange.transparent,
layerMask = 1 << LayerDefine.SHADOW
};
context.DrawRenderers(cull.visibleRenderers, ref settings, filterSettings);
}
之后,我们只需要再在Render方法中依次调用DrawBg和DrawShadow即可。
public override void Render(ScriptableRenderContext context, Camera[] cameras)
{
base.Render(context, cameras);
if (cmd == null)
{
cmd = new CommandBuffer();
}
foreach (var camera in cameras)
{
if (!CullResults.GetCullingParameters(camera, out cullingParams))
continue;
CullResults.Cull(ref cullingParams, context,ref cull);
context.SetupCameraProperties(camera);
cmd.Clear();
cmd.ClearRenderTarget(true, true, Color.black,1.0f);
context.ExecuteCommandBuffer(cmd);
SetUpDirectionalLightParam(cull.visibleLights);
//Draw
DrawCharacter(context, camera, zPrepass, SortFlags.OptimizeStateChanges);
DrawBg(context, camera);
DrawShadow(context, camera);
context.Submit();
}
}
渲染的结果便是:
角色、背景、阴影分别渲染,互不干扰,而DrawCall也从Unity默认的管线中的3700次降低到了使用我们自定义管线的20次。
0x03 小结
利用SRP,我们可以根据项目自身的特点来定制很多有趣的内容,从这个小的演示中我们应该可以体验到这种灵活性所带来的性能上的提升。
好了,如果有技术讨论的需求,欢迎加群:
Unity官方中文社区群:470161914
Unity官方中文社区②群:629212643
Ref
[1]https://blogs.unity3d.com/cn/2018/01/31/srp-overview/
[2]https://github.com/wotakuro/CustomScriptRenderPipelineTest
开发自定义ScriptableRenderPipeline,将DrawCall降低180倍的更多相关文章
- BizTalk开发系列(二十二) 开发自定义Map Functoid
尽管 BizTalk Server 提供许多Functoid以支持一系列不同的操作,但仍可能会遇到需要其他方法的情况.<BizTalk开发系列 Map扩展开发>介绍了通过使用自定义 XSL ...
- [转]jquery开发自定义的插件总结
本文转自:http://www.cnblogs.com/Jimmy009/archive/2013/01/17/jquery%E6%8F%92%E4%BB%B6.html 前几天在玩jquery,今天 ...
- 基于Spring的可扩展Schema进行开发自定义配置标签支持
一.背景 最近和朋友一起想开发一个类似alibaba dubbo的功能的工具,其中就用到了基于Spring的可扩展Schema进行开发自定义配置标签支持,通过上网查资料自己写了一个demo.今天在这里 ...
- 开发自定义View
当开发者打算派生自己的UI组件时,首先定义一个继承View基类的子类,然后重写View类的一个或多个方法,通常可以被用户重写的方法如下:构造器:重写构造器是定制View的最基本方法,当Java代码创建 ...
- JSP进阶 之 SimpleTagSupport 开发自定义标签
绝大部分 Java 领域的 MVC 框架,例如 Struts.Spring MVC.JSF 等,主要由两部分组成:控制器组件和视图组件.其中视图组件主要由大量功能丰富的标签库充当.对于大部分开发者而言 ...
- 记微信开发(自定义回复&关注回复)
记微信开发(自定义回复&关注回复) 记微信开发(自定义回复&关注回复) code: <?php/** * wechat php test *///define your toke ...
- 在 Visual C++ 中开发自定义的绘图控件
本文讨论的重点介于两者 之间 — 公共控件赋予您想要的大部分功能,但控件的外观并不是您想要的.例如,列表视图控件提供在许多视图风格中显示数据列表的方式 — 小图标.大图标.列表和详细列表(报告).然而 ...
- 【小程序】小程序开发自定义组件的步骤>>>>>>>>>小程序开发过程中报错:jsEnginScriptError
报错:jsEnginScriptError VM6342: jsEnginScriptError Component is not found in path "component/spac ...
- 【转】OpenWRT开发自定义应用方法
[转]OpenWRT开发自定义应用方法 转自:http://blog.csdn.net/rudyn/article/details/38616783 OpenWRT编译成功完成后,所有的产品都会放在编 ...
随机推荐
- 关于PCB走线能不能走锐角的讨论
(此文参考吴川斌的博客) 很多PCB工程师都知道Layout走线时忌走直角,那么锐角能走吗? 回答当然是否定的!为什么呢? 这里先不说锐角对高速信号走线会不会造成负面影响,单从PCB DFM(可制造性 ...
- win10系统下使用markdown2出现的问题
1.转载自:http://blog.csdn.net/chengjierui/article/details/53065599 电脑系统升级Win10后启动不了Markdown Pad2,报错’Awe ...
- CentOS7没有eth0网卡
本人刚刚进去运维圈,写写博客,记录一下自己日常工作学习中的各种问题,方便自己,方便他人. CentOS7系统安装完毕之后,输入ifconfig命令发现没有eth0,不符合我们的习惯.而且也无法远程ss ...
- C++中的继承(2)类的默认成员
在继承关系里面, 在派生类中如果没有显示定义这六个成员函数, 编译系统则会默认合成这六个默认的成员函数. 1.构造与析构函数的调用关系 调用关系先看一段代码: class Base { public ...
- WPF管理系统自定义分页控件 - WPF特工队内部资料
最近做一个演示的管理系统项目,需要用到分页控件,在网上找了很多,依然找到与UI模版匹配的,最后干脆自己写一个. 分页控件分析: 1.分页控件分简单显示和复杂显示两种: 2.包含上一页.下一页以及页码明 ...
- os模块walk方法
1.os.walk import os for root, dirs, files in os.walk(top, topdown=False): for name in files: os.remo ...
- CentOs下手动升级node版本
查找对应的nodejs包,具体参考https://nodejs.org/download/release/ 切换到安装node的位置 此处为/usr/local/lib/nodejs 不存在可以建立 ...
- Hadoop HDFS安装、环境配置
hadoop安装 进入Xftp将hadoop-2.7.3.tar.gz 复制到自己的虚拟机系统下的放软件的地方,我的是/soft/software 在虚拟机系统装软件文件里,进行解压缩并重命名 进入p ...
- 《JAVA程序设计》结对编程联系_四则运算(第二周:整体性总结)
结对对象与其博客链接 20175312陶光远:https://www.cnblogs.com/20175312-tgy/p/10697238.html 需求分析 (一)功能需求 1.自动生成题目(上周 ...
- 用DFS求连通块(种子填充)
[问题] 输入一个m行n列的字符矩阵,统计字符“@”组成多少个八连块.如果两个字符“@”所在的格子相邻(横.竖或者对角线方向),就说它们属于同一个八连块.例如,图6-9中有两个八连块. 图6-9 [分 ...