[工作积累] UE4 TAA ReProjection的精度处理

先贴一个UE4 TAA的slide
https://de45xmedrsdbp.cloudfront.net/Resources/files/TemporalAA_small-59732822.pdf

里面细节问题很多，先记录一下目前想到和遇到的问题，便于备忘，后面有空的话再记录。

TAA用到的Velocity和抖动对精度要求比较高，特别是大场景下误差容易比较大，UE4做了一系列的处理来保持精度。

投影矩阵的精度

     static const FMatrix InvertProjectionMatrix( const FMatrix& M )

     {

         if( M.M[][] == 0.0f &&

             M.M[][] == 0.0f &&

             M.M[][] == 0.0f &&

             M.M[][] == 0.0f &&

             M.M[][] == 0.0f &&

             M.M[][] == 0.0f &&

             M.M[][] == 0.0f &&

             M.M[][] == 0.0f &&

             M.M[][] == 1.0f &&

             M.M[][] == 0.0f )

         {

             // Solve the common case directly with very high precision.

             /*

             M =

             | a | 0 | 0 | 0 |

             | 0 | b | 0 | 0 |

             | s | t | c | 1 |

             | 0 | 0 | d | 0 |

             */

             double a = M.M[][];

             double b = M.M[][];

             double c = M.M[][];

             double d = M.M[][];

             double s = M.M[][];

             double t = M.M[][];

             return FMatrix(

                 FPlane( 1.0 / a, 0.0f, 0.0f, 0.0f ),

                 FPlane( 0.0f, 1.0 / b, 0.0f, 0.0f ),

                 FPlane( 0.0f, 0.0f, 0.0f, 1.0 / d ),

                 FPlane( -s/a, -t/b, 1.0f, -c/d )

             );

         }

         else

         {

             return M.Inverse();

         }

     }

可以看到对投影矩阵的取反做了特殊处理，来提高浮点计算精度。

视图矩阵的精度

     FVector DeltaTranslation = InPrevViewMatrices.GetPreViewTranslation() - InViewMatrices.GetPreViewTranslation();

     FMatrix InvViewProj = InViewMatrices.ComputeInvProjectionNoAAMatrix() * InViewMatrices.GetTranslatedViewMatrix().GetTransposed();

     FMatrix PrevViewProj = FTranslationMatrix(DeltaTranslation) * InPrevViewMatrices.GetTranslatedViewMatrix() * InPrevViewMatrices.ComputeProjectionNoAAMatrix();

     ViewUniformShaderParameters.ClipToPrevClip = InvViewProj * PrevViewProj;

将视图矩阵的位移和旋转拆开来（T*R），以避免大地图上，相机位置过大造成的误差。

Reprojection是把当前帧Clip space或NDC space的点重新投影到上一帧的位置

Reprojection = (V*P)^-1 * (PrevV*PrevP)

= P^-1 * V^-1 * PrevV * PrevP

其中V为视图矩阵，P为投影矩阵。

而UE4的视图矩阵实际使用TR的方式（类似变换矩阵的TRS和RTS的顺序，区别是试图矩阵没有缩放， https://docs.microsoft.com/en-us/dotnet/framework/winforms/advanced/why-transformation-order-is-significant

注意如果是相同的T和R， T*R和R*T结果是不一样的，这里的TR，是在ViewMatrix结果一样的前提上，拆解出的另外两个矩阵，从几何分析的角度也可以得出）

Reprojection = P^-1 * (T*R)^-1 * (PrevT*PrevR) * prevP

= P^-1 * R^-1 * T^-1 * PrevT * PrevR * PrevP

= P^-1 * R^-1 * (T^-1 * PrevT) * PrevR * PrevP

其中:
Reprojection是UE4代码里的ViewUniformShaderParameters.ClipToPrevClip，
R是ViewMatrix的旋转部分（UE4代码中的GetTranslatedViewMatrix），
T是ViewMatrix的位移部分，

T^-1*PrevT 就是UE4代码中的 FTranslationMatrix(DeltaTranslation) 。

这样做的好处是，把两个绝对位置转换为一个相对位移，从而避免绝对位置过大而导致的矩阵Inverse的精度问题。

同时，视图矩阵的旋转部分 R 是正交矩阵，所以Transpose等价于Inverse，这样不仅是效率的提高，更重要的是避免了Inverse导致的浮点误差。

VelocityBuffer的精度

 // for velocity rendering, motionblur and temporal AA

 // velocity needs to support -2..2 screen space range for x and y

 // texture is 16bit 0..1 range per channel

 float2 EncodeVelocityToTexture(float2 In)

 {

     // 0.499f is a value smaller than 0.5f to avoid using the full range to use the clear color (0,0) as special value

     // 0.5f to allow for a range of -2..2 instead of -1..1 for really fast motions for temporal AA

     return In * (0.499f * 0.5f) + 32767.0f / 65535.0f;

 }

 // see EncodeVelocityToTexture()

 float2 DecodeVelocityFromTexture(float2 In)

 {

     const float InvDiv = 1.0f / (0.499f * 0.5f);

     // reference

 //    return (In - 32767.0f / 65535.0f ) / (0.499f * 0.5f);

     // MAD layout to help compiler

     return In * InvDiv - 32767.0f / 65535.0f * InvDiv;

 }

VelocityBuffer在TAA里用来reproject移动的物体，包括蒙皮动画和位移旋转动画等。

为了提高精度，VelocityBuffer可以使用Float32。Unity使用的是Float16x2 (R16G16F)，不同的是，UE4使用的是INT16x2 (R16G16_INT)。
对于Float16，最小精度是2^-10。如果映射到Int16，去掉等价的符号位，精度是2^-15。这样在占用同样显存大小的情况下，提高了精度。

[工作积累] UE4 TAA ReProjection的精度处理的更多相关文章

[工作积累] UE4 并行渲染的同步 - Sync between FParallelCommandListSet & FRHICommandListImmediate calls
UE4 的渲染分为两个模式1.编辑器是同步绘制的 2.游戏里是FParallelCommandListSet并行派发的. mesh渲染也分两类,static mesh 使用TStaticMeshDra ...
[工作积累] TAA Ghosting 的相关问题
因为TAA要使用上一帧的历史结果,那么在相机移动的时候,颜色就会有残留,出现ghosting(残影). 由于上一帧历史是累积的,是由上一帧的直接渲染结果和上上帧的结果做了合并,所以ghosting并不 ...
[工作积累] Tricks with UE4 PerInstanceRandom
最近在用UE4的Instancing, 发现限制很多. Unity有instancing的attribute array (uniform/constant buffer),通过InstanceID来 ...
[工作积累] D3D10+ 中 Pixel Shader 的input semantic和参数顺序
由于semantic的使用,我们有理由相信 vertex shader的output 和 pixel shader的input是按照semantic来匹配的,而跟传入顺序无关.印象dx9时代是这样. ...
[工作积累] shadow map问题汇总
1.基本问题和相关 Common Techniques to Improve Shadow Depth Maps: https://msdn.microsoft.com/en-us/library/w ...
[工作积累] Google/Amazon平台的各种坑
所谓坑, 就是文档中没有标明的特别需要处理的细节, 工作中会被无故的卡住各种令人恼火的问题. 包括系统级的bug和没有文档化的限制. 继Android的各种坑后, 现在做Amazon平台, 遇到的坑很 ...
[工作积累] 32bit to 64bit: array index underflow
先贴一段C++标准(ISO/IEC 14882:2003): 5.2.1 Subscripting: 1 A postfix expression followed by an expression ...
[工作积累] bitfield
ISO/IEC 14882:2003: 9.6 Bit-fields [class.bit] A member-declarator of the form identifieropt : const ...
[工作积累] GCC 4.6 new[] operator内存对齐的BUG
对于用户没有定义dctor(包括其所有成员)的类来说, new CLASS[n] 可能会直接请求sizeof(CLASS)*n的空间. 而带有dctor的类, 因为delete[]的时候要逐个调用析 ...

随机推荐

asp调用短信接口实现用户注册
前几天做一个asp语言开发的网站需要实现用户注册短信验证功能,就研究了一下如何实现,简单给大家分享下调用过程. 首先需要找到一个第三方短信接口,当时用的是动力思维乐信的短信接口. 首先需要先注册个动力 ...
Android : 高通平台Camera调试之SetpropKey/camxoverridesettings.txt
高通相关网址:Createpoint: https://createpoint.qti.qualcomm.com(可下载文档,Release Note等)Chipcode: https://chipc ...
windows下启动和运行分布式消息中间件消息队列 kafka
本文转载至:https://www.cnblogs.com/flower1990/p/7466882.html 一.安装JAVA JDK 1.下载安装包 http://www.oracle.com/t ...
Scrapy的piplines.py存储文件和存储mongodb
一.将数据保存到文件 1.piplines.py文件 import json class TencentPipeline(object): def open_spider(self,spider): ...
ansible资产配置
参考链接:https://www.cnblogs.com/iois/p/6403761.html ansible主机组的使用,我们在对一个集群进行管理的时候集群会有很多角色,在执行统一命令操作的时候我 ...
docker学习---第一章节
一.docker的应用场景有哪些 Web 应用的自动化打包和发布自动化测试和持续集成.发布在服务型环境中部署和调整数据库或其他的后台应用从头编译或者扩展现有的OpenShift或Cloud Fo ...
将 Range 对象赋给变量
有多种方法将现有的 Range 对象赋给变量.本主题对两种不同的方法进行了阐述.在下列示例中,将 Range 对象赋给变量 Range1 和 Range2.例如,下列指令将活动文档中的第一个和第二个单 ...
Python成长之路【第三篇】函数
函数一.背景在学习函数之前,一直遵循:面向过程编程,即:根据业务逻辑从上到下实现功能,其往往用一长段代码来实现指定功能,开发过程中最常见的操作就是粘贴复制,也就是将之前实现的代码块复制到现需功能处 ...
java版数据结构与算法第二章数组
数组由一组具有相同类型的数据元素组成,并存储在一组连续存储单元中.一维数组是常量. 二维数组:若一维数组中的数据元素又是一堆数据结构,我们称之为二维数组.二维数组可以看成是n个列向量组成的线性表. 数 ...
v-echart 按需加载
import 'v-charts/lib/style.css';import VeBar from 'v-charts/lib/bar' // 条形图import VeRadar from 'v-ch ...

[工作积累] UE4 TAA ReProjection的精度处理

[工作积累] UE4 TAA ReProjection的精度处理的更多相关文章

随机推荐

热门专题