[工作积累] UE4 并行渲染的同步 - Sync between FParallelCommandListSet & FRHICommandListImmediate calls
UE4 的渲染分为两个模式1.编辑器是同步绘制的 2.游戏里是FParallelCommandListSet并行派发的。
mesh渲染也分两类,static mesh 使用TStaticMeshDrawList 来绘制, skinned mesh是用DrawingPolicyFactory::DrawDynamicMesh来画。这两类绘制不管是异步还是同步都会调用。具体可以参考DepthRendering.cpp
实际上,有在DX12/Vulkan/Metal 这些支持paralle commit的API上才会真正并行派发,否则GRHIThread为nullptr,还是在最后某个时刻把所有Task阻塞式提交的,Task的执行顺序不确定,但不是并发的。
一般来说每个DrawList的DrawVisibleParallel会自己创建一个Task, DrawDynamicMesh都是自己创建的Task。这些task按不确定的顺序执行,因为有pre depth或者depth buffer,所以乱序绘制没有问题,只有半透明物体需需要按顺序绘制,所以只有一个DrawList,对应一个Task。Task内部的绘制都是按先后顺序的。
工作中遇到的问题:
目前自定义的部分流程是
1.draw objects A (parallel)
2.copy scene color (immediate)
3.draw objects B (parallel)
其中第二部必须在第一步结束之后才能开始。因为使用了FParallelCommandListSet, 并仿照DeferredShadingRenderer.cpp 里, 在向CommandList里添加调用以后,使用了ServiceLocalQueue() 来同步。
代码:
class FCustomPassDynamicDataThreadTask : public FRenderTask {...};
class FCustomParallelCommandListSet : public FParallelCommandListSet {...};
...
//Step 1
FCustomParallelCommandListSet ParallelSet(View, RHICmdList, true, CVarRHICmdFlushRenderThreadTasks.GetValueOnRenderThread() == );
//Render Static Mesh
Scene->CustomDrawList.DrawVisibleParallel(ParallelSet.View.StaticMeshVisibilityMap, ParallelSet.View.StaticMeshBatchVisibility, ParallelSet);
// Render dynamic mesh
FRHICommandList* CmdList = ParallelSet.NewParallelCommandList();
FGraphEventRef AnyThreadCompletionEvent = TGraphTask<FCustomPassDynamicDataThreadTask>::CreateTask(ParallelSet.GetPrereqs(), ENamedThreads::RenderThread)
.ConstructAndDispatchWhenReady(*this, *CmdList, View, ParallelSet.DrawRenderState);
ParallelSet.AddParallelCommandList(CmdList, AnyThreadCompletionEvent);
ServiceLocalQueue();
//Step 2
RHICmdList.CopyToResolveTarget(...); // or CopySubTextureRegion
...
发现并不能同步结果, 第二步复制的SceneColor里并没有第一步绘制的物体。
仔细查看代码,发现FParallelCommandListSet的dispatch都是在析构函数里执行的,比如DepthRendering.cpp 绘制depth pre pass: 而我的FCustomParallelCommandListSet也是(部分)抄他的(他注释里说了不要无脑复制粘贴),类似。
DepthRendering.cpp:
class FPrePassParallelCommandListSet : public FParallelCommandListSet
{
public:
FPrePassParallelCommandListSet(const FViewInfo& InView, FRHICommandListImmediate& InParentCmdList, bool bInParallelExecute, bool bInCreateSceneContext)
: FParallelCommandListSet(GET_STATID(STAT_CLP_Prepass), InView, InParentCmdList, bInParallelExecute, bInCreateSceneContext)
{
// Do not copy-paste. this is a very unusual FParallelCommandListSet because it is a prepass and we want to do some work after starting some tasks
} virtual ~FPrePassParallelCommandListSet()
{
// Do not copy-paste. this is a very unusual FParallelCommandListSet because it is a prepass and we want to do some work after starting some tasks
SetStateOnCommandList(ParentCmdList);
Dispatch(true);
} virtual void SetStateOnCommandList(FRHICommandList& CmdList) override
{
FParallelCommandListSet::SetStateOnCommandList(CmdList);
FSceneRenderTargets::Get(CmdList).BeginRenderingPrePass(CmdList, false);
SetupPrePassView(CmdList, View, DrawRenderState);
}
};
也就是说,需要FCustomParallelCommandListSet()析构以后,同步才有用,否则的话,还没有任务dispatch,sync什么。于是代码修改如下:
class FCustomPassDynamicDataThreadTask : public FRenderTask {...};
class FCustomParallelCommandListSet : public FParallelCommandListSet {...};
...
//Step 1
//Note: the local scope is necessary because FCustomParallelCommandListSet dispatches in dector.
{
FCustomParallelCommandListSet ParallelSet(View, RHICmdList, true, CVarRHICmdFlushRenderThreadTasks.GetValueOnRenderThread() == );
//Render Static Mesh
Scene->CustomDrawList.DrawVisibleParallel(ParallelSet.View.StaticMeshVisibilityMap, ParallelSet.View.StaticMeshBatchVisibility, ParallelSet);
// Render dynamic mesh
FRHICommandList* CmdList = ParallelSet.NewParallelCommandList();
FGraphEventRef AnyThreadCompletionEvent = TGraphTask<FCustomPassDynamicDataThreadTask>::CreateTask(ParallelSet.GetPrereqs(), ENamedThreads::RenderThread)
.ConstructAndDispatchWhenReady(*this, *CmdList, View, ParallelSet.DrawRenderState);
ParallelSet.AddParallelCommandList(CmdList, AnyThreadCompletionEvent);
}
ServiceLocalQueue();
RHICmdList.ImmediateFlush(EImmediateFlushType::DispatchToRHIThread);
//Step 2
RHICmdList.CopyToResolveTarget(...); //or CopySubTextureRegion
...
是的,就是加了个花括号,问题就解决了一半。
另外,第二部Copy SceneColor的时候,可能在其他一个线程的Command还没完全派发到GPU,如果不同步的话,复制出来的SceneColor copy,在采样时会闪烁。
然而使用了ServiceLocalQueue()以后,结果仍然不正确。这样以来ServiceLocalQueue()的意义感觉不明 - 并不是在等待task执行结束。但可以确定的是DrawVisibleParallel/DrawDynamicMesh使用的异步模式,而传入的RHICmdList是FRHICommandListImmediate,也就是立即执行的,两种方式肯定需要同步。
既然ServiceLocalQueue()和预想的等待或者同步不同,所以尝试在ServiceLocalQueue()后面加上
RHICmdList.ImmediateFlush(EImmediateFlushType::DispatchToRHIThread);
结果才正确。
还有一个方式就是把一系列DrawVisibleParallel/DrawDynamic和CopyResovleTarget放在一个Task里,因为Task的内部执行是按顺序的,不需要同步,但是只有一个Task,在支持并行发射Command的GPU下就没有并发了。而且每个DrawVisibleParallel会创建一个Task,需要把这些所有操作合并到一个task里,具体没有试过。
如果把CopyResolveTarget放到另外一个Task,使用异步模式,结果也是不对的。虽然这些Task在非DX12/Vulkan/Metal下是非并发的,按顺序的,但是执行顺序是不确定的。
至于并发+同步开销大还是单一task效率更高,依赖于draw call的数量,具体需要profiling。
[工作积累] UE4 并行渲染的同步 - Sync between FParallelCommandListSet & FRHICommandListImmediate calls的更多相关文章
- [工作积累] UE4 TAA ReProjection的精度处理
先贴一个UE4 TAA的slidehttps://de45xmedrsdbp.cloudfront.net/Resources/files/TemporalAA_small-59732822.pdf ...
- Centos7.5部署MySQL5.7基于GTID主从复制+并行复制+半同步复制+读写分离(ProxySQL) 环境- 运维笔记 (完整版)
之前已经详细介绍了Mysql基于GTID主从复制的概念,原理和配置,下面整体记录下MySQL5.7基于GTID主从复制+并行复制+增强半同步复制+读写分离环境的实现过程,以便加深对mysql新特性GT ...
- MySQL 5.7 基于GTID主从复制+并行复制+半同步复制
环境准备 IP HOSTNAME SERVICE SYSTEM 192.168.131.129 mysql-master1 mysql CentOS7.6 192.168.131.130 mysql- ...
- C#并行编程-线程同步原语
菜鸟学习并行编程,参考<C#并行编程高级教程.PDF>,如有错误,欢迎指正. 目录 C#并行编程-相关概念 C#并行编程-Parallel C#并行编程-Task C#并行编程-并发集合 ...
- Android源码浅析(三)——Android AOSP 5.1.1源码的同步sync和编译make,搭建Samba服务器进行更便捷的烧录刷机
Android源码浅析(三)--Android AOSP 5.1.1源码的同步sync和编译make,搭建Samba服务器进行更便捷的烧录刷机 最近比较忙,而且又要维护自己的博客,视频和公众号,也就没 ...
- 转载 三、并行编程 - Task同步机制。TreadLocal类、Lock、Interlocked、Synchronization、ConcurrentQueue以及Barrier等
随笔 - 353, 文章 - 1, 评论 - 5, 引用 - 0 三.并行编程 - Task同步机制.TreadLocal类.Lock.Interlocked.Synchronization.Conc ...
- 三、并行编程 - Task同步机制。TreadLocal类、Lock、Interlocked、Synchronization、ConcurrentQueue以及Barrier等
在并行计算中,不可避免的会碰到多个任务共享变量,实例,集合.虽然task自带了两个方法:task.ContinueWith()和Task.Factory.ContinueWhenAll()来实现任务串 ...
- 同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式
1. 概念理解 在进行网络编程时,我们常常见到同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式: 同步/异步主要针对C端: 同步: ...
- [工作积累] Tricks with UE4 PerInstanceRandom
最近在用UE4的Instancing, 发现限制很多. Unity有instancing的attribute array (uniform/constant buffer),通过InstanceID来 ...
随机推荐
- MySql5.5安装详细说明
双击MySql5.5安装文件开始: next 打勾,Next 选Custom,原因如下面所述: Typical(典型安装) Installs the most common program fea ...
- weblogic中部署项目通常有三种方式
在weblogic中部署项目通常有三种方式:第一,在控制台中安装部署:第二,将部署包放在domain域中autodeploy目录下部署:第三,使用域中配置文件config.xml 进行项目的部署. 控 ...
- ASP中替换掉换行符<br>
function HtmlStrReplace(Str) if Str="" or isnull(Str) then HtmlStrReplace="" ...
- Visual C++没事别启用/Za编译选项
Visual C++对于C++标准的支持不是很完善好像是钦定了的.MS还特意在这里说了些非标准行为[1]以及扩展行为[2].这就不可避免地会让处女座程序猿感到难受(我不是处女座).所以,经过一番goo ...
- find命令配合sed命令使用
1.查找当前目录下所有以txt文件中包含123的数字都替换成5678 find ./ -name "*.txt" -exec grep "123" {} \; ...
- vim 匹配查找指定位置的数字,并将数字做运算后赋值
举例,以下文本中有个DSC开头的以数字命名的jpg文件,我想修改文件名为在原来的基础上加上32,比如第一行中的字符改为:DSC00099.JPG 在vim中输入: :%s/DSC[]\+\(\d\+\ ...
- 一个切换内外网IP地址的批处理BAT
做了一个切换内外网的小脚本.没想到这个老的没剩几颗牙的DOS竟然功能如此强大.盛名之下名副其实啊!不亏是想当年叱咤风云的操作系统啊! 脚本内容1.建立两个TXT文件,分别按行存储内外网的IP,MASK ...
- Keil的断点调试问题解决
keil只有在程序能正常运行时才能添加断点后在点击调试任务时,断点标记不消失
- 运维route语法
Linux系统的route命令用于显示和操作IP路由表(show / manipulate the IP routing table).要实现两个不同的子网之间的通信,需要一台连接两个网络的路由器,或 ...
- linux中tar及压缩解压命令用法
把常用的tar解压命令总结下,当作备忘: tar 命令可以为Linux的文件和目录创建档案.利用 tar,可以为某一特定文件创建档案(备份文件),也可以在档案中改变文件,或者向 档案中加入新的文件.t ...