用DirectX12实现Blinn Phong
这次我们来用DirectX12实现一下基本的Blinn Phong光照模型。让我们再把这个光照模型的概念过一遍:一个物体的颜色由三个因素决定:ambient, diffuse, specular。ambient表示场景中的其他物体反射出来的光线到该物体所呈现的颜色,与摄像机所在的位置无关;diffuse表示物体内部所吸收的光线反射出来所呈现的颜色,它是完全杂乱无章而且随机的,可以假设散射到任意方向的分量都是相等的,因此也与摄像机所在的位置无关;specular表示物体根据Fresnel效应,入射光线镜面反射出去所呈现的颜色:
float3 SchlickFresnel(float3 r0, float3 normal, float3 lightVec)
{
float nDotL = max(0, dot(normal, lightVec));
float3 reflectPercent = r0 + (1 - r0) * pow(1 - nDotL, 5);
return reflectPercent;
}
float4 BlinnPhong(float3 lightStrength, float3 lightVec, float3 normal, float3 toEye, Material mat)
{
float4 ambient = gAmbientLight * mat.diffuseAlbedo;
float3 halfVec = normalize(lightVec + toEye);
float roughness = (mat.shininess + 8) * pow(max(0, dot(halfVec, normal)), mat.shininess) / 8.0f;
float3 fresnel = SchlickFresnel(mat.fresnelR0, halfVec, lightVec);
float3 specularAlbedo = fresnel * roughness;
float3 litColor = ambient.rgb + (mat.diffuseAlbedo.rgb + specularAlbedo) * lightStrength;
return float4(litColor.rgb, diffuseAlbedo.a);
}
让我们从shader代码一行行地看过去。
首先ambient分量的计算比较好理解,就是我们假定场景中其他环境散射过来的光照强度为gAmbientLight
,而mat
是物体的材质属性,diffuseAlbedo
表示该材质对不同颜色光的rgb分量的反射率。
再看diffuse
分量的计算,也很简单,lightStrength
表示入射光的光照强度,具体这个光照强度怎么计算的,我们先放到后面说,也很容易理解材质的``diffuseAlbedo属性乘以入射光的光照得到的就是
diffuse`分量。
最后来看下specular
分量的计算,这个相对比较复杂,我们首先假设物体表面其实是凹凸不平的,是由若干个微表面所组成。而只有镜面反射向量恰好为视线所在方向的微表面,才会对specular
分量做出贡献。也即这些微表面的法向量都满足:
normal = halfVec = normalize(lightVec + toEye);
那么,这样的微表面有多少呢?有一点我们是知道的,这些微表面中,与物体表面法线偏移程度越小的,可能性越大;偏离越远的,可能性越小。自然而然,我们想到可以用cos
三角函数来衡量两个向量的临近程度。
另外,我们在材质上引入了shininess
这个概念,它表示物体表面的光滑程度,物体越光滑,微表面法线集中分布在接近物体表面法线的地方上,这样看上去高光会比较集中锐利;物体越粗糙,微表面法线会相对均匀分布在不同临近程度上,这样看上去高光会形成一块光斑。通过以上两点,我们得到:
float roughness = (mat.shininess + 8) * pow(max(0, dot(halfVec, normal)), mat.shininess) / 8.0f;
还有一点别忘了,不是所有的入射光都参与这个镜面反射高光计算,我们根据Fresnel效应计算得到参与镜面反射的光照:
float3 fresnel = SchlickFresnel(mat.fresnelR0, halfVec, lightVec);
float3 specularAlbedo = fresnel * roughness;
最后,我们回过头来说下lightStrength
这个光照强度的计算。在Blinn Phong光照模型中,入射的光有三种类型,directional,point,spot。下面分别讨论不同类型的光照强度计算:
directional即平行光,从无穷远处的光源发射出来,光照强度不会随着距离衰减。容易知道,当平行光的方向与物体表面垂直时,物体接受到的光照强度是最大的;而当平行光方向与物体表面的法线的夹角为\(\theta\)时,相同密度下的光照要覆盖\(1/cos\theta\)的物体表面。所以,平行光的光照强度为:
float3 dir = -light.direction;
float nDotL = max(0, dot(dir, normal));
float3 lightStrength = light.strength * nDotL;
point即为点光源,光源有一个具体的位置,朝任意方向发射光线,而且光照强度会随着距离不断衰减,这里衰减我们简化采用线性衰减的方式:
float3 dir = light.position - pos;
float dist = length(dir);
if (dist >= light.falloffEnd)
{
float3 lightStrength = 0.0f;
}
else
{
dir /= dist;
float nDotL = max(0, dot(dir, normal));
float falloff = saturate((light.falloffEnd - dist) / (light.falloffEnd - light.falloffStart));
float3 lightStrength = light.strength * nDotL * falloff;
}
spot即为聚光灯,光源有一个具体的位置,并且只向某个具体的方向发射光线。在这个方向的一定范围内的物体才能接受到光照,光照强度也会随着距离不断衰减。类似specular分量的计算,我们也可以用相同的方式对不同光照方向的光照强度进行建模:
float3 dir = light.position - pos;
float dist = length(dir);
if (dist >= light.falloffEnd)
{
float3 lightStrength = 0.0f;
}
else
{
dir /= dist;
float nDotL = max(0, dot(dir, normal));
float falloff = saturate((light.falloffEnd - dist) / (light.falloffEnd - light.falloffStart));
float spotFactor = pow(max(0, dot(-dir, light.direction)), light.spotPower);
float3 lightStrength = light.strength * nDotL * falloff * spotFactor;
}
至此,我们shader部分算是构建完成了。我们还需要在DirectX12中把hlsl中所用的全局变量通过const buffer传递过去,我们先在hlsl部分中定义所需的全局变量:
cbuffer cbPerObject : register(b0)
{
float4x4 gWorld;
float4x4 gInvWorld;
float4x4 gWorldViewProj;
};
cbuffer cbPerPass : register(b1)
{
float3 gEyePosW;
int gLightCount;
float4 gAmbientLight;
Light gLights[16];
};
cbuffer cbPerMaterial : register(b2)
{
float4 diffuseAlbedo;
float3 fresnelR0;
float shininess;
};
之所以定义3个const buffer,是因为不同buffer的更新频率不一样,有的是每个pass就需要更新,有的是只有某个object发生变化才需要更新,有的是只有某个material发生变化才需要更新。需要注意的是,cbuffer中变量定义的顺序至关重要。为了保证4字节对齐,我们需要调整变量定义的顺序,避免让类似一个float3,float4横跨两个4字节的情况出现,而发生一些不可预料的错误。
回到DirectX12,我们首先需要创建3个const buffer:
ThrowIfFailed(mDevice->CreateCommittedResource(&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_UPLOAD),
D3D12_HEAP_FLAG_NONE, &CD3DX12_RESOURCE_DESC::Buffer(mObjectConstBufferCount * objCbSize),
D3D12_RESOURCE_STATE_GENERIC_READ, nullptr, IID_PPV_ARGS(&res.mObjectConstBuffer)));
ThrowIfFailed(mDevice->CreateCommittedResource(&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_UPLOAD),
D3D12_HEAP_FLAG_NONE, &CD3DX12_RESOURCE_DESC::Buffer(mPassConstBufferCount * passCbSize),
D3D12_RESOURCE_STATE_GENERIC_READ, nullptr, IID_PPV_ARGS(&res.mPassConstBuffer)));
ThrowIfFailed(mDevice->CreateCommittedResource(&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_UPLOAD),
D3D12_HEAP_FLAG_NONE, &CD3DX12_RESOURCE_DESC::Buffer(mMaterialConstBufferCount * matCbSize),
D3D12_RESOURCE_STATE_GENERIC_READ, nullptr, IID_PPV_ARGS(&res.mMaterialConstBuffer)));
接下来,我们要创建const buffer view,将buffer资源绑定到heap上:
UINT cbvHeapIndex = 0;
for (UINT i = 0; i < mCoreResourceCount; i++)
{
EngineCoreResource res = mCoreResource[i];
D3D12_GPU_VIRTUAL_ADDRESS objCbAddr = res.mObjectConstBuffer->GetGPUVirtualAddress();
for (UINT j = 0; j < mObjectConstBufferCount; j++)
{
D3D12_CONSTANT_BUFFER_VIEW_DESC cbvDesc;
cbvDesc.BufferLocation = objCbAddr + j * objCbSize;
cbvDesc.SizeInBytes = objCbSize;
CD3DX12_CPU_DESCRIPTOR_HANDLE handle = CD3DX12_CPU_DESCRIPTOR_HANDLE(
mCbvHeap->GetCPUDescriptorHandleForHeapStart());
handle.Offset(cbvHeapIndex, mCbvHeapIncSize);
mDevice->CreateConstantBufferView(&cbvDesc, handle);
cbvHeapIndex++;
}
D3D12_GPU_VIRTUAL_ADDRESS passCbAddr = res.mPassConstBuffer->GetGPUVirtualAddress();
for (UINT j = 0; j < mPassConstBufferCount; j++)
{
D3D12_CONSTANT_BUFFER_VIEW_DESC cbvDesc;
cbvDesc.BufferLocation = passCbAddr + j * passCbSize;
cbvDesc.SizeInBytes = passCbSize;
CD3DX12_CPU_DESCRIPTOR_HANDLE handle = CD3DX12_CPU_DESCRIPTOR_HANDLE(
mCbvHeap->GetCPUDescriptorHandleForHeapStart());
handle.Offset(cbvHeapIndex, mCbvHeapIncSize);
mDevice->CreateConstantBufferView(&cbvDesc, handle);
cbvHeapIndex++;
}
D3D12_GPU_VIRTUAL_ADDRESS matCbAddr = res.mMaterialConstBuffer->GetGPUVirtualAddress();
for (UINT j = 0; j < mMaterialConstBufferCount; j++)
{
D3D12_CONSTANT_BUFFER_VIEW_DESC cbvDesc;
cbvDesc.BufferLocation = matCbAddr + j * matCbSize;
cbvDesc.SizeInBytes = matCbSize;
CD3DX12_CPU_DESCRIPTOR_HANDLE handle = CD3DX12_CPU_DESCRIPTOR_HANDLE(
mCbvHeap->GetCPUDescriptorHandleForHeapStart());
handle.Offset(cbvHeapIndex, mCbvHeapIncSize);
mDevice->CreateConstantBufferView(&cbvDesc, handle);
cbvHeapIndex++;
}
}
然后,我们需要创建根签名,用来指明hlsl需要3个const buffer,分别使用寄存器b0,b1,b2存放数据:
CD3DX12_DESCRIPTOR_RANGE cbvTable[3];
cbvTable[0].Init(D3D12_DESCRIPTOR_RANGE_TYPE_CBV, 1, 0);
cbvTable[1].Init(D3D12_DESCRIPTOR_RANGE_TYPE_CBV, 1, 1);
cbvTable[2].Init(D3D12_DESCRIPTOR_RANGE_TYPE_CBV, 1, 2);
CD3DX12_ROOT_PARAMETER rootParams[3];
rootParams[0].InitAsDescriptorTable(1, &cbvTable[0]);
rootParams[1].InitAsDescriptorTable(1, &cbvTable[1]);
rootParams[2].InitAsDescriptorTable(1, &cbvTable[2]);
CD3DX12_ROOT_SIGNATURE_DESC sigDesc(3, rootParams, 0, nullptr,
D3D12_ROOT_SIGNATURE_FLAG_ALLOW_INPUT_ASSEMBLER_INPUT_LAYOUT);
这里我们用了3个根参数,是因为我们需要根据不同时机和不同的调用频率,调用SetGraphicsRootDescriptorTable
设置不同的buffer绑定到GPU上,用3个根参数就比较方便灵活。拷贝const buffer数据到GPU层的代码就不贴了,这个和之前的操作方式基本一致,只要记住只在必要的时间拷贝必要的数据即可。
让我们看一下最终的效果,这里加载了一个简单的汽车模型,用了3个平行光源:
如果你觉得我的文章有帮助,欢迎关注我的微信公众号(大龄社畜的游戏开发之路)-
用DirectX12实现Blinn Phong的更多相关文章
- KlayGE 4.4中渲染的改进(四):SSSSS
转载请注明出处为KlayGE游戏引擎,本文的永久链接为http://www.klayge.org/?p=2774 本系列的上一篇提到了KlayGE 4.4将会出现的高质量地形渲染.本篇仍讲一个新功能, ...
- Opengles 管线编程介绍
OpenGL ES 2.0可编程管道 上图橙色部分(Vertex Shader和Fragment Shader)为此管道的可编程部分.整个管道包含以下两个规范: 1) OpenGL ...
- 合金装备V 幻痛 制作技术特辑
合金装备V:幻痛 制作特辑 资料原文出自日版CGWORLD2015年10月号 在[合金装备4(Metal Gear Solid IV)]7年后,序章作品[合金装备5 :原爆点 (Metal Gea ...
- 【Aladdin Unity3D Shader编程】之三 光照模型(二)
高光反射模型 Specular=直射光*pow(cosθ,高光的参数) θ:是反射光和视野方向的夹角 编写高光反射Shader Shader "AladdinShader/07 Specul ...
- 【Unity Shader】(六) ------ 复杂的光照(上)
笔者使用的是 Unity 2018.2.0f2 + VS2017,建议读者使用与 Unity 2018 相近的版本,避免一些因为版本不一致而出现的问题. [Unity Sha ...
- 三种光照模型的shader实现
1.Lambert模型,公式为I=Kd*Il(N*L): Shader "Custom/Lambert_A" { Properties { _Diffuse(,,,) } SubS ...
- 【温故知新】——BABYLON.js学习之路·前辈经验(二)
前言:在上一篇随笔BABYLON.js学习之路·前辈经验(一)中回顾了组内同事们长时间在Babylon开发实践中的总结出的学习之路和经验,这一篇主要对开发中常见的一些功能点做一个梳理,这里只作为温故知 ...
- Unity 图形学 基础知识总结
1. 渲染流水线 三大块:应用阶段,几何阶段,光栅化阶段 渲染图元 顶点信息 GPU流水线 顶点数据=> 顶点着色器 ...
- 腾讯暑期 前后七面 + hr(已拿offer面经)
以下是时间线 魔方 魔术师工作室 3.19 一面(120mins) c++ struct和union区别? 指针和引用的区别? 左值和右值? 字节对齐的作用? 什么情况下需要自定义new? mallo ...
随机推荐
- pip install 一个本地包时提示error: Microsoft Visual C++ 14.0 is required.
错误如下: error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Too ...
- [大雾雾雾雾] 告别该死的 EFCore Fluent API (续)
朋友们好啊, 我是 .NET 打工人 玩双截棍的熊猫 刚才有个朋友问我 猫猫发生什么事了 我说 怎么回事? 给我发了一张截图 我一看!嗷!原来是zuo天有两个数据库, 一个四十多岁,一个三十多岁 它们 ...
- ubuntu解决安装速度问题
速度慢得原因:linux系统很多的软件源链接都是在国外服务器上,由于国内防火墙影响导致下载速度极慢,甚至超时. 解决办法一:购买梯子 这样你就可以快速的下载国外服务器的软件包了,但是你得有个可靠得梯子 ...
- 10万级etl批量作业自动化调度工具Taskctl之轻量级Web应用版
什么是批量作业: 批量处理是银行业整个信息后台最为重要的技术形态,也是银行核心信息资产数据的分享.传输.演化的重要技术手段.有调查指出,全球70%的数据是经过批量处理得以再次使用,可见批量处理在整个信 ...
- 做IT需要掌握的电力基础知识
电流 损耗 直流电的传输损耗大,所以不适合长距离传输, 交流电的传输损耗小,所以适合长距离传输, 使用 直流电电压稳定,无白躁声,故适於电子产品使用(例如电视机,收音机电脑等), 交流电要经过整流/开 ...
- 03_Service的绑定
Start Service启动的Service,Application退出,Service也不会退出: Bind Service启动的Service,Application退出,Service就会退出 ...
- JZOJ2020年10月5日提高B组反思
2020年10月5日提高B组反思 T1 考试的时候想简单了 觉得把跟没有攻占的点相连的边留下就可以了 没有考虑到最小 WA&RE 10 T2 没有思路 就直接从中间往后枚举分解处 蜜汁错误 W ...
- charles功能(三)弱网测试(模拟超慢网速,会导致接口数据返回超时的那种慢)
模拟超慢网速(会导致接口数据返回超时的那种...) 设置带宽和延迟时间(毫秒) 注:可以根据下图中的翻译体会下导致网络延迟的原因: 然后打开网页回变得非常满
- 从TFS到git的持续集成之路
前言 公司目前使用TFS,由于TFS不灵活不能很好的持续集成,且给测试造成很大重的负担,所以近期准备迁移到git上 目标 解决项目运转的瓶颈(版本太多,导致测试跟不上,需引入自动化测试) 过程 主线分 ...
- 老猿学5G:3GPP和中国移动5G计费架构概览
☞ ░ 前往老猿Python博文目录 ░ 一.引言 老猿学5G这个专栏主要记录笔者因工作原因学习了解5G计费相关知识,文章按时间顺序循序渐进的介绍5G基础概念以及5G计费相关知识,该专栏前期已经完结, ...