UE4 的渲染分为两个模式1.编辑器是同步绘制的 2.游戏里是FParallelCommandListSet并行派发的。

mesh渲染也分两类,static mesh 使用TStaticMeshDrawList 来绘制, skinned mesh是用DrawingPolicyFactory::DrawDynamicMesh来画。这两类绘制不管是异步还是同步都会调用。具体可以参考DepthRendering.cpp

实际上,有在DX12/Vulkan/Metal 这些支持paralle commit的API上才会真正并行派发,否则GRHIThread为nullptr,还是在最后某个时刻把所有Task阻塞式提交的,Task的执行顺序不确定,但不是并发的。

一般来说每个DrawList的DrawVisibleParallel会自己创建一个Task, DrawDynamicMesh都是自己创建的Task。这些task按不确定的顺序执行,因为有pre depth或者depth buffer,所以乱序绘制没有问题,只有半透明物体需需要按顺序绘制,所以只有一个DrawList,对应一个Task。Task内部的绘制都是按先后顺序的。

工作中遇到的问题:

目前自定义的部分流程是

1.draw objects A (parallel)

2.copy scene color (immediate)

3.draw objects B (parallel)

其中第二部必须在第一步结束之后才能开始。因为使用了FParallelCommandListSet, 并仿照DeferredShadingRenderer.cpp 里, 在向CommandList里添加调用以后,使用了ServiceLocalQueue() 来同步。

代码:

 class FCustomPassDynamicDataThreadTask : public FRenderTask {...};
class FCustomParallelCommandListSet : public FParallelCommandListSet {...}; ...
//Step 1
FCustomParallelCommandListSet ParallelSet(View, RHICmdList, true, CVarRHICmdFlushRenderThreadTasks.GetValueOnRenderThread() == );
//Render Static Mesh
Scene->CustomDrawList.DrawVisibleParallel(ParallelSet.View.StaticMeshVisibilityMap, ParallelSet.View.StaticMeshBatchVisibility, ParallelSet); // Render dynamic mesh
FRHICommandList* CmdList = ParallelSet.NewParallelCommandList();
FGraphEventRef AnyThreadCompletionEvent = TGraphTask<FCustomPassDynamicDataThreadTask>::CreateTask(ParallelSet.GetPrereqs(), ENamedThreads::RenderThread)
.ConstructAndDispatchWhenReady(*this, *CmdList, View, ParallelSet.DrawRenderState);
ParallelSet.AddParallelCommandList(CmdList, AnyThreadCompletionEvent); ServiceLocalQueue(); //Step 2
RHICmdList.CopyToResolveTarget(...); // or CopySubTextureRegion
...

发现并不能同步结果, 第二步复制的SceneColor里并没有第一步绘制的物体。

仔细查看代码,发现FParallelCommandListSet的dispatch都是在析构函数里执行的,比如DepthRendering.cpp 绘制depth pre pass: 而我的FCustomParallelCommandListSet也是(部分)抄他的(他注释里说了不要无脑复制粘贴),类似。

DepthRendering.cpp:

 class FPrePassParallelCommandListSet : public FParallelCommandListSet
{
public:
FPrePassParallelCommandListSet(const FViewInfo& InView, FRHICommandListImmediate& InParentCmdList, bool bInParallelExecute, bool bInCreateSceneContext)
: FParallelCommandListSet(GET_STATID(STAT_CLP_Prepass), InView, InParentCmdList, bInParallelExecute, bInCreateSceneContext)
{
// Do not copy-paste. this is a very unusual FParallelCommandListSet because it is a prepass and we want to do some work after starting some tasks
} virtual ~FPrePassParallelCommandListSet()
{
// Do not copy-paste. this is a very unusual FParallelCommandListSet because it is a prepass and we want to do some work after starting some tasks
SetStateOnCommandList(ParentCmdList);
Dispatch(true);
} virtual void SetStateOnCommandList(FRHICommandList& CmdList) override
{
FParallelCommandListSet::SetStateOnCommandList(CmdList);
FSceneRenderTargets::Get(CmdList).BeginRenderingPrePass(CmdList, false);
SetupPrePassView(CmdList, View, DrawRenderState);
}
};

也就是说,需要FCustomParallelCommandListSet()析构以后,同步才有用,否则的话,还没有任务dispatch,sync什么。于是代码修改如下:

 class FCustomPassDynamicDataThreadTask : public FRenderTask {...};
class FCustomParallelCommandListSet : public FParallelCommandListSet {...}; ...
//Step 1
//Note: the local scope is necessary because FCustomParallelCommandListSet dispatches in dector.
{
FCustomParallelCommandListSet ParallelSet(View, RHICmdList, true, CVarRHICmdFlushRenderThreadTasks.GetValueOnRenderThread() == );
//Render Static Mesh
Scene->CustomDrawList.DrawVisibleParallel(ParallelSet.View.StaticMeshVisibilityMap, ParallelSet.View.StaticMeshBatchVisibility, ParallelSet); // Render dynamic mesh
FRHICommandList* CmdList = ParallelSet.NewParallelCommandList();
FGraphEventRef AnyThreadCompletionEvent = TGraphTask<FCustomPassDynamicDataThreadTask>::CreateTask(ParallelSet.GetPrereqs(), ENamedThreads::RenderThread)
.ConstructAndDispatchWhenReady(*this, *CmdList, View, ParallelSet.DrawRenderState);
ParallelSet.AddParallelCommandList(CmdList, AnyThreadCompletionEvent);
} ServiceLocalQueue();
RHICmdList.ImmediateFlush(EImmediateFlushType::DispatchToRHIThread); //Step 2
RHICmdList.CopyToResolveTarget(...); //or CopySubTextureRegion
...

是的,就是加了个花括号,问题就解决了一半。

另外,第二部Copy SceneColor的时候,可能在其他一个线程的Command还没完全派发到GPU,如果不同步的话,复制出来的SceneColor copy,在采样时会闪烁。

然而使用了ServiceLocalQueue()以后,结果仍然不正确。这样以来ServiceLocalQueue()的意义感觉不明 - 并不是在等待task执行结束。但可以确定的是DrawVisibleParallel/DrawDynamicMesh使用的异步模式,而传入的RHICmdList是FRHICommandListImmediate,也就是立即执行的,两种方式肯定需要同步。

既然ServiceLocalQueue()和预想的等待或者同步不同,所以尝试在ServiceLocalQueue()后面加上

RHICmdList.ImmediateFlush(EImmediateFlushType::DispatchToRHIThread);

结果才正确。

还有一个方式就是把一系列DrawVisibleParallel/DrawDynamic和CopyResovleTarget放在一个Task里,因为Task的内部执行是按顺序的,不需要同步,但是只有一个Task,在支持并行发射Command的GPU下就没有并发了。而且每个DrawVisibleParallel会创建一个Task,需要把这些所有操作合并到一个task里,具体没有试过。

如果把CopyResolveTarget放到另外一个Task,使用异步模式,结果也是不对的。虽然这些Task在非DX12/Vulkan/Metal下是非并发的,按顺序的,但是执行顺序是不确定的。

至于并发+同步开销大还是单一task效率更高,依赖于draw call的数量,具体需要profiling。

[工作积累] UE4 并行渲染的同步 - Sync between FParallelCommandListSet & FRHICommandListImmediate calls的更多相关文章

  1. [工作积累] UE4 TAA ReProjection的精度处理

    先贴一个UE4 TAA的slidehttps://de45xmedrsdbp.cloudfront.net/Resources/files/TemporalAA_small-59732822.pdf ...

  2. Centos7.5部署MySQL5.7基于GTID主从复制+并行复制+半同步复制+读写分离(ProxySQL) 环境- 运维笔记 (完整版)

    之前已经详细介绍了Mysql基于GTID主从复制的概念,原理和配置,下面整体记录下MySQL5.7基于GTID主从复制+并行复制+增强半同步复制+读写分离环境的实现过程,以便加深对mysql新特性GT ...

  3. MySQL 5.7 基于GTID主从复制+并行复制+半同步复制

    环境准备 IP HOSTNAME SERVICE SYSTEM 192.168.131.129 mysql-master1 mysql CentOS7.6 192.168.131.130 mysql- ...

  4. C#并行编程-线程同步原语

    菜鸟学习并行编程,参考<C#并行编程高级教程.PDF>,如有错误,欢迎指正. 目录 C#并行编程-相关概念 C#并行编程-Parallel C#并行编程-Task C#并行编程-并发集合 ...

  5. Android源码浅析(三)——Android AOSP 5.1.1源码的同步sync和编译make,搭建Samba服务器进行更便捷的烧录刷机

    Android源码浅析(三)--Android AOSP 5.1.1源码的同步sync和编译make,搭建Samba服务器进行更便捷的烧录刷机 最近比较忙,而且又要维护自己的博客,视频和公众号,也就没 ...

  6. 转载 三、并行编程 - Task同步机制。TreadLocal类、Lock、Interlocked、Synchronization、ConcurrentQueue以及Barrier等

    随笔 - 353, 文章 - 1, 评论 - 5, 引用 - 0 三.并行编程 - Task同步机制.TreadLocal类.Lock.Interlocked.Synchronization.Conc ...

  7. 三、并行编程 - Task同步机制。TreadLocal类、Lock、Interlocked、Synchronization、ConcurrentQueue以及Barrier等

    在并行计算中,不可避免的会碰到多个任务共享变量,实例,集合.虽然task自带了两个方法:task.ContinueWith()和Task.Factory.ContinueWhenAll()来实现任务串 ...

  8. 同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式

    1. 概念理解        在进行网络编程时,我们常常见到同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式:   同步/异步主要针对C端: 同步:    ...

  9. [工作积累] Tricks with UE4 PerInstanceRandom

    最近在用UE4的Instancing, 发现限制很多. Unity有instancing的attribute array (uniform/constant buffer),通过InstanceID来 ...

随机推荐

  1. sql表中数据遍历

    步骤: 1:先定义一个临时表,把需要用的数据放入临时表中,如果数据不连续,则在临时表中定义一个自增长键 DECLARE @temp table(Id INT IDENTITY(1, 1) ,ShopC ...

  2. ubuntu 谷歌浏览器打开时需要输入密码来解锁密码环

    问题: ubuntu14.04, 设置系统自动登陆账户,但每次开机打开 google chromium 浏览器,会要求输入一次密码,来解锁登录密钥环.很麻烦. 解锁登录密钥环:输入密码以解锁您的登录密 ...

  3. Flask项目笔记

    一.jsonify  jsonify 是flask的函数,可以将字典转换成json数据返回给浏览器二. 钩子函数 @app.before_first_request:第一次请求调用,用于初始化数据 @ ...

  4. tp5.0中使用PHPexcel,以及Loader的一些问题

    在5.0中使用PHPexcel遇到一些问题,记录一下方便以后查看. 非使用PHPexcel的方法: 参考:http://blog.csdn.net/sinat_35861727/article/det ...

  5. jQuery 入口函数主要有4种写法

    jqery  入口函数主要有4种写法,其中以第3种方法最为方便. <!DOCTYPE html> <html lang="en"> <head> ...

  6. Flutter错误集合

    一.Waiting for another flutter command to release the startup lock... 运行flutter命令 flutter upgrade 运行 ...

  7. selenium中下拉框的定位

    from selenium import webdriverfrom selenium.webdriver.support.select import Selectimport timedriver ...

  8. selenium中切换浏览器不同tab 的操作

    from selenium import webdriverimport timedriver=webdriver.Chrome()driver.get('http://ui.imdsx.cn/uit ...

  9. Sonar 平台搭建及 Sonar 自定义规则打包部署篇

    引言 基于阿里开发手册的sonar自定义插件工程 开源地址: https://github.com/tigerge000/sonar-java-custom-rules.git由于最近来问童鞋,就算写 ...

  10. 使用VMware Workstation 14 Player或者Oracle VM VirtualBox安装Fedora-Workstation-netinst-x86_64-27-1.6操作系统的相关记录

    无论是在使用哪个(VMware或者Oracle VM)都遇到了一个问题:即使在安装完Fedoras操作系统之后,进行Reboot还是会进入之前一摸一样的安装界面,相当于再次安装.然而最最有效的解决办法 ...