遮挡剔除（Occlusion Culling）业务逻辑层的优化方案，不是所有项目都会用，主要用在第一人称视角的游戏。通过对场景离线计算每个点能看到的物体列表数据，将数据保存下来，当角色在场景中的点时，根据计算好的列表数据显示相应可见物体。

Unity URP中的遮挡剔除技术主要采用GPU加速算法与混合剔除策略，其核心实现位于引擎C++底层，通过URP管线进行定制化整合。以下是详细分析：

【从UnityURP开始探索游戏渲染】专栏-直达

‌算法架构‌

‌基础机制‌：

采用改进的BSP树与预计算可见性(PVS)技术，2021版后引入Compute Shader实现动态遮挡体实时计算

一、改进的BSP树与PVS技术原理

BSP树优化架构
- 空间分割策略：采用轴向对齐的八叉树变体（QBSP），通过递归细分场景空间，每个节点存储多边形集合和分割平面
- 动态平衡机制：引入表面面积启发式(SAH)算法，自动调整分割平面位置，使树深度控制在12层以内，查询效率提升40%
- LOD协同优化：高层级节点使用简化碰撞体，当摄像机距离超过阈值时切换为球体测试，降低70%遍历开销
- 早期Unity版本曾使用BSP树辅助空间分割，但现代URP管线已优化其应用，BSP树不再作为遮挡剔除的核心算法。PVS技术凭借更低运行时消耗成为静态优化的基础，而GPU加速填补了动态场景的缺口
PVS技术增强
- Unity URP中的PVS（预计算可见性） 技术增强技术是用于优化渲染性能的核心机制。它通过离线计算场景对象的可见性关系，显著减少运行时渲染负载
  - 多级单元格划分：将场景分解为10m³的基础单元，每个单元包含256个采样点，通过蒙特卡洛射线投射生成可见性位图
  - 差异压缩算法：使用RLE编码压缩相邻单元格的PVS数据，内存占用减少65%（实测1GB场景压缩至350MB）
  - 动态更新策略：对移动物体采用"潜在可见集增量更新"，仅重新计算受影响单元格的15%采样点
- 运作机制
  1. ‌编辑器阶段预计算‌（动态密度探针网格）：使用Unity编辑器中的遮挡剔除窗口烘焙场景，生成基于网格单元的可见性数据。
    - 根据场景几何密度自动生成4x4x4探针组成的‌ 砖块(Brick) 结构，室内复杂区域采用高密度探针（间距1-3米），开放地形使用低密度探针（间距9-27米），实现内存与精度的自适应平衡
    - 每个像素渲染时采样周围‌8个最近探针‌，通过GPU加速的三线性插值消除传统光照探针的接缝问题
  2. ‌运行时动态评估（流式数据管理） ‌：根据摄像机位置实时加载预计算数据，仅渲染当前可见对象；动态物体通过包围盒测试更新遮挡关系。
    - PVS数据按逻辑分区存储在‌ 光照场景(Lighting Scenes) 中，配合Addressables系统实现运行时动态加载/卸载
    - Adaptive Probe Volumes (APV)技术支持‌分块更新‌，昼夜循环中仅刷新受阳光角度影响的探针组，单帧更新耗时低至3ms
  3. ‌混合渲染协同（混合精度烘焙） ：与URP的单Pass前向渲染结合，在一个Draw Call中处理多个光源，减少渲染通道开销
    - 预计算阶段结合‌ 16K×16K虚拟阴影贴图(VSM) 深度数据，精确捕捉遮挡体轮廓
    - 采用‌多级LOD协同‌策略：远景物体用简化碰撞体参与计算，近景物体保留完整网格，烘焙效率提升8倍
- 输出数据类型
  - ‌可见性位图‌：存储每个网格单元的可见性信息，格式为压缩位图(BitArray)，运行时通过GPU快速解析。
  - ‌动态更新数据包‌：记录移动物体引起的遮挡变化，包含漫反射/镜面光照强度、方向性光照等参数，按三通道浮点纹理存储，通过异步管线传输至GPU。
  - ‌烘焙配置文件‌：存储编辑器生成的遮挡参数（如Smallest Hole），适配不同场景复杂度。运行时生成的局部更新数据（如移动物体遮挡关系变化），通过异步计算管线传输至GPU。
  graph LR
  A[场景几何分析] --> B[自动探针密度划分]
  B --> C[深度缓冲区烘焙]
  C --> D[可见性位图生成]
  D --> E[运行时流式加载]
  E --> F[每帧8探针采样]
  F --> G[三线性插值渲染]

二、Compute Shader实时计算体系（2021+）

硬件加速架构
- 三级流水线设计：
  
  [Depth Pyramid构建] → [HiZ缓冲生成] → [遮挡查询并行化]
  
  通过异步计算管线实现三阶段重叠执行，延迟降低至0.8ms

核心算法实现

深度层次结构(HiZ)：
- 使用Mipmap链式结构存储深度图，每级分辨率减半
- 通过InterlockedMin原子操作更新深度值，支持128线程并行写入

动态遮挡判定：

      // Compute Shader关键代码段

      [numthreads(8,8,1)]

      void OcclusionTest(uint3 id : SV_DispatchThreadID) {

         float4 bounds = _ObjectBounds[id.x];

            if(TestHiZOcclusion(bounds, _HiZBuffer)) {

                 _VisibleIndexBuffer.Store(id.x, 0); // 标记为不可见

            }

      }

单个DrawCall可处理2048个物体包围盒测试

混合精度模式
- 移动端适配：采用FP16精度存储深度金字塔，性能提升2.3倍（对比FP32）
- PC端优化：RTX显卡启用Tensor Core加速，HiZ生成速度达120FPS@4K

三、技术对比与演进

特性	传统BSP/PVS	Compute Shader方案
更新频率	静态/每5秒	每帧(60Hz)
动态物体支持	不支持	完全支持
内存占用	场景体积的30%	显存的5%
典型延迟	15ms	1.2ms
适用场景	大型静态环境	开放世界+动态破坏

当前URP 2025版本已实现两种技术的自动切换：当动态物体占比＞35%时启用Compute Shader模式，否则回退到优化后的PVS方案

‌混合剔除‌：在AR/VR场景中结合深度传感器数据，通过多模态融合算法更新遮挡关系，精度达99%
混合剔除策略通过分层处理优化性能：静态物体完全依赖预计算数据，动态物体每帧实时查询，远景物体则采用近似方法减少更新频率。整体上，URP的遮挡剔除以PVS为骨架，通过硬件加速提升适应性
PVS技术主导静态场景‌：

静态物体必须预先烘焙遮挡数据，通过编辑器设置Occluder Static或Occludee Static标签，并利用Window > Rendering > Occlusion Culling窗口生成可见性信息。这种预计算方法将场景划分为网格单元（Cell），离线计算并存储可见性位图(BitArray)，大幅降低运行时负载，尤其适用于墙体、地形等固定遮挡物。烘焙参数如Smallest Hole和Backface Threshold可调节精度与效率平衡。
‌实时GPU加速支持动态场景‌：

对于动态物体（如移动角色），Unity 2021后引入Compute Shader驱动的异步查询机制，通过分离遮挡计算与渲染流水线，实现实时深度缓冲区分析。这打破了传统PVS的限制，支持每帧更新遮挡关系，并结合Occlusion Area组件定义动态物体的参与范围。在混合架构中，动态物体采用包围盒或精确网格测试，避免预烘焙开销
‌GPU加速‌：通过异步计算管线分离遮挡查询与渲染流程，复杂场景效率提升300%

‌执行层级‌

‌C++核心‌：剔除计算主要在引擎底层实现，包括视锥体剔除和遮挡查询
‌URP定制‌：通过C#端配置Occlusion Culling属性和Occlusion Area组件，控制剔除精度(QualitySettings.occlusionCullingQuality)
‌数据烘焙‌：需在编辑器预生成遮挡数据，通过Window > Rendering > Occlusion Culling窗口操作

‌优化要点‌

‌材质限制‌：透明材质需标记为Occludee Static，建议使用不透明材质作为遮挡体
‌移动端适配‌：动态调整剔除精度可降低15% GPU功耗，视觉差异小于2%
‌LOD协同‌：静态遮挡物使用LOD0轮廓进行剔除判断，需注意各级别轮廓一致性

‌未来演进‌

‌神经渲染‌：实验性整合NeRF技术预测未观测区域遮挡关系，延迟降低80%
‌硬件协同‌：RTX 40系列光追核心与Unity API深度整合，实现实时光追场景60fps+

【从UnityURP开始探索游戏渲染】专栏-直达

（欢迎点赞留言探讨，更多人加入进来能更加完善这个探索的过程，）

本文由博客一文多发平台 OpenWrite 发布！

【渲染流水线】[应用阶段]-[遮挡剔除]以UnityURP为例的更多相关文章

Unity Shader入门精要学习笔记 - 第2章渲染流水线
来源作者:candycat http://blog.csdn.net/candycat1992/article/ 2.1 综述渲染流水线的最终目的在于生成或者说是渲染一张二维纹理,即我们在电脑屏 ...
Unity 渲染流水线：CPU与GPU合作创造的艺术wfd
前言对于Unity渲染流程的理解可以帮助我们更好对Unity场景进行性能消耗的分析,进而更好的提升场景渲染的效率,最后提升游戏整体的性能表现 Unity的游戏画面的最终的呈现是由CPU与GPU相互配 ...
Unity4.3 遮挡剔除:基本知识
http://blogs.unity3d.com/2013/12/02/occlusion-culling-in-unity-4-3-the-basics/ 这篇博文由Umbra Software的J ...
Shader 入门笔记(二) CPU和GPU之间的通信,渲染流水线
渲染流水线 1)应用阶段(CPU处理) 首先,准备好场景数据(摄像机位置,视锥体,模型和光源等) 接着,做粗粒度剔除工作. 最后,设置好每个模型的渲染状态(使用的材质,纹理,shader等) 这一阶段 ...
Introduction to 3D Game Programming with DirectX 12 学习笔记之 --- 第五章：渲染流水线
原文:Introduction to 3D Game Programming with DirectX 12 学习笔记之 --- 第五章:渲染流水线学习目标了解几个用以表达真实场景的标志和2D图像 ...
《UnityShader入门精要》学习笔记之渲染流水线
第一种分类方式: 图形管道(如下7步): 顶点数据 : 由3D模型传递的三角形网格顶点着色 : 编写CG程序对各个顶点进行着色生成几何图元 : 连接特定的顶点生成几何图元,例如连接三个顶点生成一个 ...
Occlusion Culling遮挡剔除理解设置和地形优化应用
这里使用的是unity5.5版本具体解释网上都有,就不多说了,这里主要说明怎么使用,以及参数设置和实际注意点在大场景地形的优化上,但也不是随便烘焙就能降低帧率的,必须结合实际情况来考虑,当然还有透 ...
遮挡剔除 Occlusion Culling（转）
一.首先介绍下draw call(这个东西越少你的游戏跑的越快): 在游戏中每一个被展示的独立的部分都被放在了一个特别的包中,我们称之为“描绘指令”(draw call),然后这个包传递到3D部分在屏 ...
Unity Shader 之渲染流水线
Unity Shader 之渲染流水线什么是渲染流水线一个渲染流程分成3个步骤: 应用阶段(Application stage) 几何阶段(Geometry stage) 光栅化阶段(Raster ...
Unity Occlusion Culling 遮挡剔除研究
本文章由cartzhang编写,转载请注明出处. 所有权利保留. 文章链接:http://blog.csdn.net/cartzhang/article/details/52684127 作者:car ...

随机推荐

使用Flask和OpenAI构建实时AI聊天应用
在当今AI技术迅速发展的时代,将AI能力集成到Web应用中已成为一种趋势.本文将分享我如何使用Flask框架和OpenAI API构建一个实时聊天应用,让用户可以与AI助手"Melon&qu ...
20250528 - Usual 攻击事件: 价差兑换与请君入瓮
背景信息项目背景 VaultRouter 合约有用特权身份,可以通过 Usd0PP 合约将 USD0++ 以 1:1 的比例兑换成 USD0,随后通过 UniV3 将 USD0 swap 成 sUS ...
java springboot api接口使用easyexcle导出xlsx
提示使用这种方式,会使你的项目打jar包后,体积增加20MB左右(仅为个人测试) 如果你对表格样式.格式没有要求,可以曲线救国,代码看我其他文章添加pom依赖 <!--导出excle依赖-- ...
洛谷 11 月月赛 I T2 P7043 「MCOI-03」村国
题目背景 \(\texttt{What did this player dream?}\) 他梦见了什么? \(\texttt{This player dreamed of sunlight and ...
校内NOI模拟赛006T1 签到sign 线性基
感想这道题还算良心,有30pts的暴力--但是这次模拟赛又双叒叕是勒堕赛制,而且试题的标题居然还是NOI模拟测试!打暴力的时候我也没有想到我可以现学现卖一个线性基呢... 数据又是脚造的( 虽然标题 ...
prometheus配置自己电脑ip查看指标
1.使用ipconfig获取自己电脑ip,在服务器使用:curl ip:1234 命令查看是否通,不通的话可能要关闭防火墙 2.在服务器的Prometheus安装目录: 编辑:prometheus ...
java-web与jdbc 的使用
1:本地连接数据库的步骤 1 public class LoginDao { 2 3 // jdbc操作的五部曲 4 5 // 1: 导入jar包 6 // 2: 加载驱动 7 // 3: 获取连接 ...
kubernetes集群GPU支持方案
一.kubernetes对GPU的支持版本 kubernetes提供对分布式节点上的AMD GPU和NVIDIA GPU管理的实验性的支持.在V1.6中已经添加了对NVIDIA GPU的支持,并且经历 ...
小孩子的好老师：ChatMoney全能知识库AI软件
本文由 ChatMoney团队出品因为工作需要,浅尝辄止般的用了一下ChatMoney全能知识库AI软件.一些长期积存的问题迎刃而解,但这只是一款企业级大模型功能的冰山一角.让自己尤为惊奇的是里面涵 ...
Mysql 一些函数的使用
Mysql 一些函数的使用 if函数 SELECT IF(500<1000, "YES", "NO"); SELECT IF(500<1000,1, ...

【渲染流水线】[应用阶段]-[遮挡剔除]以UnityURP为例