内容来源:华为开发者大会2021 HMS Core 6 Graphics技术论坛,主题演讲《CG Kit探索移动端高性能渲染》

演讲嘉宾:华为海思麒麟GPU团队工程师

大家好,我来自华为海思麒麟团队的一名GPU研发工程师,今天给大家带来的主题是“CG Kit探索移动端高性能渲染”。

华为图形计算服务(Computer Graphics Kit,简称“CG Kit”)提供最前沿计算机图形学领域的渲染框架、插件SDK与GPU扩展接口,协助开发者挖掘硬件极限性能,大幅降低开发难度,帮助开发者创造出体验更佳的产品。

那么,CG Kit能提供哪些解决方案呢?

一、Vulkan渲染框架实践

Vulkan是最新的图形标准API,相较于OpenGL具备一定的优势,并且OpenGL这个标准已经停止演进,未来图形学基本上以Vulkan向前演进。举个例子,移动端的光线追踪就是在Vulkan中描述,并且在OpenGL中是没有的。但问题在于,Vulkan非常灵活,它相较OpenGL有一定的使用门槛,所以就需要有基于Vulkan高性能的渲染框架,以此提供实践架构和方案,充分发挥出硬件性能。

二、高性能渲染插件

CG Kit提供多线程渲染、拍照超分、体积云、遮挡剔除等一系列渲染能力的插件,以便于三方合作的顺利进行,比如去年的网易《天谕》手游就集成了拍照超分的算法。

三、开发者工具链

CG Kit也提供了完整的开发者工具链,我们可以帮助开发者迅速定位解决渲染功能和性能问题。大家可以想象一下,如果未来工具可以自动识别游戏场景中的一些功能/性能问题并反馈给开发者,这将极大提升我们的开发效率。

四、前沿图形技术探索

一直以来CG Kit团队都在对前沿图形技术进行探索,比如,我们如何把AI的技术应用到图形渲染中,目前我们已在AI超分、自动3D人脸建模,AI协同动画生成等方面有所研究成果。

Vulkan渲染框架实践

Vulkan渲染框架实践,为开发者提供Vulkan渲染解决方案优化、渲染增强插件和渲染技术文档,比如,文档中会介绍一些API使用策略、资源缓存使用优化、Vulkan的兼容性问题等等。

前面提到Vulkan是比较新的API,它的Command Buffer机制可以天然支持多线程渲染。由于Vulkan比较灵活,CG Kit就会针对Vulkan的API做了简化封装,使用起来更便利。

其次, CG Kit也支持基于物理的渲染,PBR可以真实地反映物体表面光照的属性,通过PBR我们渲染出来的物体会更加的真实。

同时,CG Kit提供了资源管理器,可以将所用到的大量管线资源尽可能地进行复用,从而降低开销,提高渲染性能。

最后,CG Kit同样支持提供HDR10的显示能力,配合HDR屏幕的显示优化,最终出图会有更好的动态范围。

静态超分组件

下面介绍一下游戏拍照超分的插件,游戏是具有社交属性的,分享就是社交里非常重要的一个环节。在游戏过程中经常会遇到一些非常值得分享的精彩时刻,比如完成了一个里程碑的任务,获取了一个限量款精美的皮肤,或者已经完成了一个虚拟人物形象定制……在这些时刻,游戏玩家非常迫切地想把这些精彩的瞬间分享给自己的朋友,那就需要用到拍照的功能,但是如何让拍照的效果更好呢?

针对拍照效果,CG Kit提供了两种解决方案。

第一种解决方案就是针对具有独立NPU的高端手机,例如麒麟980、990和麒麟9000芯片对应的手机,这些具有独立高端NPU的手机可以直接调用AI超分接口,这样画面细节得以显著增加,画面风格更加清晰自然,从下面的对比图可以看出,处理后的图片人物面部细节明显有提升。

而针对那些没有独立NPU芯片的手机,我们也提供了一种通用的解决方案,叫作FilterSR,这是基于通用GPU的一种算法,应用这种算法后,没有NPU的手机也可以大幅提升画面效果,并且相较于传统的方法它的锯齿感和画面清晰度也有很大的提升。值得一提的是,《天谕》就集成了我们拍照超分的算法。

体积云组件

CG Kit也提供了移动端高性能的体积云插件,体积云技术可以实时动态地渲染出高度真实云海中全局光照场景,并且支持玩家在云中任意地穿梭,画面可以真实还原云朵的物理特性。比如,玩家在穿梭过程中扑面而来的粒子感,还有真实的光照效果,包括云朵边缘的细节等等,都会有非常好的呈现。从下图可以看出,这个云朵的颜色是随着时间的变化在逐步变化的,就是因为我们对光照做了24小时的适配。

在体积云的形态方面,我们支持真实和卡通两个风格,还支持任意形状的Mash转换成体积云,这样可以满足开发者不同的定制需求。

从性能角度看,在麒麟980这个平台上,我们可以做到4毫秒以内渲染1帧,插件显示上,同时提供了PC端和移动端的插件,一般来说开发者是在移动端上进行编辑调试,并在移动端上以SO的方式集成,而它的包体大小只有400K左右。

体积雾组件

下面介绍一下体积雾组件,在一些特定游戏风格的游戏中,具有高度真实的光和雾的效果会给大家带来非常好的体验,比如去年有一款非常火的游戏,叫《赛博朋克2077》,它里面就有很多雾效。

主机3A大作中,体积雾一般是通过体渲染来实现的,不同于表面渲染只需要渲染物体表面,体渲染要渲染物体内部,渲染工作量可能是表面渲染的几十倍上百倍,体渲染对硬件的性能要求非常高,这也是一直没有在移动端落地的原因。

而CG Kit体积雾的组件对传统的体渲染做了很多优化,我简单介绍两种优化。

第一种优化是针对多光源场景下的优化。多光源的时候,渲染的工作量是成几十倍的增加,针对这个问题我们引入了光源剔除技术,让光照计算只发生在光源所影响的局部范围内,这样就可以大幅地降低渲染的工作量。

第二种优化是,为了提升渲染的效率,我们采用了降低采样率的方式,但是降低采样率以后会存在画面细节不足的问题,为了解决这个问题,我们引入了时域滤波技术,把当前帧和上一帧的结果融合,这样也会得到一个非常不错的结果。数据结构也针对这些优化做了相对性的适配。

经过前面一系列的优化之后,我们可以在移动端进行实时高性能的体积雾渲染,从性能角度来看,在麒麟980平台上,可以做到4毫秒一帧渲染;在集成形式上,可以同时提供PC端和移动端插件,支持PC端对编辑调试,移动端以SO方式集成,移动端插件包体小于500KB。

AI捏脸

最后介绍一下AI捏脸,在游戏场景中如果能够做到虚拟形象千人千面,而且它的虚拟形象能够有游戏玩家一部分的脸部特征,就会提升用户的代入感。AI捏脸以正面自拍照的方式输入,在调用我们的AI接口以后,会生成一组高度还原用户脸部特征的捏脸参数,基于捏脸参数自动生成3D模型,同时我们在追求几何相似的同时,还将真实纹理、模型纹理相融合,使得它的纹理能提现玩家的一些面部特征,还原性更高。我们在集成上提供了非常简单的接口,开发者可以便利地进行适配,也可以大幅地提升他的开发效果。

因为我们是纯端侧运行,在中高端机型AI捏脸时间小于4s,稳定性很高。同时我们的捏脸范围不但支持面部,而且还支持五官、发型、眼镜等;我们还融入了高度还原的真实纹理,有更好的还原度,并提供美观度调整功能,可以控制最终的输出图美观度。在开发效率上,开发者只需要两步就可以调用我们的功能,第一步PC端进行模型自由适配,第二步在移动端以用户的自拍照为输入就可以调用我们的接口,整个过程非常简单便捷。

希望大家可以进行深度的合作,谢谢!

了解更多详情>>

访问华为开发者联盟官网

获取开发指导文档

华为移动服务开源仓库地址:GitHubGitee

关注我们,第一时间了解 HMS Core 最新技术资讯~

CG Kit探索移动端高性能渲染的更多相关文章

  1. Weex详解:灵活的移动端高性能动态化方案

    原文地址:http://www.infoq.com/cn/articles/introducing-weex 在2016年4月份的QCon上,阿里巴巴资深总监,淘宝移动平台及新业务事业部.阿里百川负责 ...

  2. React Canvas:高性能渲染 React 组

    React Canvas 提供了使用 Canvas 渲染移动 Web App 界面的能力,替代传统的 DOM 渲染,具有更接近 Native App 的使用体验.React Canvas 提供了一组标 ...

  3. 服务端预渲染之Nuxt (使用篇)

    服务端预渲染之Nuxt - 使用 现在大多数开发都是基于Vue或者React开发的,能够达到快速开发的效果,也有一些不足的地方,Nuxt能够在服务端做出渲染,然后让搜索引擎在爬取数据的时候能够读到当前 ...

  4. 服务端预渲染之Nuxt(介绍篇)

    现在前端开发一般都是前后端分离,mvvm和mvc的开发框架,如Angular.React和Vue等,虽然写框架能够使我们快速的完成开发,但是由于前后台分离,给项目SEO带来很大的不便,搜索引擎在检索的 ...

  5. 深度揭秘阿里移动端高性能动态化方案Weex

    2016年Qcon大会首日,阿里巴巴资深总监.淘宝移动平台.阿里百川负责人庄卓然宣布移动端高性能动态化方案Weex即时内测,并将于6月开源.此消息一出,群情汹涌,在座的程序猿.攻城狮们纷纷拿起手机扫码 ...

  6. 2019-7-3-WPF-使用-Composition-API-做高性能渲染

    title author date CreateTime categories WPF 使用 Composition API 做高性能渲染 lindexi 2019-07-03 10:30:57 +0 ...

  7. AIR 3.0针对移动设备的高性能渲染方案

    转自:http://blog.domlib.com/articles/242.html 当我们一边正在等待Stage3D的发布时,很多开发者似乎还停留在这个印象中:即使AIR 3.0也无法在移动设备上 ...

  8. 移动端 像素渲染流水线与GPU Hack

    什么是 像素渲染流水线 web页面你所写的页面代码是如何被转换成屏幕上显示的像素的.这个转换过程可以归纳为这样的一个流水线,包含五个关键步骤: 1.JavaScript:一般来说,我们会使用JavaS ...

  9. Android学习探索之本地原生渲染 LaTeX数据公式

    前言: 一直致力于为公司寻找更加高效的解决方案,作为一款K12在线教育App,功能中难免会有LaTeX数学公式的显示需求,这部分公司已经实现了此功能,只是个人觉得在体验和效率上还是不太好,今天来聊一下 ...

随机推荐

  1. 国内首篇云厂商 Serverless 论文入选全球顶会:突发流量下,如何加速容器启动?

    作者 | 王骜 来源 | Serverless 公众号 导读 ​ USENIX ATC (USENIX Annual Technical Conference) 学术会议是计算机系统领域的顶级会议,入 ...

  2. 地形鞍部的提取(ArcPy实现)

    1.背景 相邻两山头之间呈马鞍形的低凹部分称为鞍部.鞍部点是重要的地形控制点,它和山顶点.山谷点及山脊线.山谷线等构成地形特征点线,对地形具有很强的控制作用.因此,因此,对这些地形特征点.线的分析研究 ...

  3. Task 异步小技巧

    原文地址:Task 异步小技巧 - 一事冇诚 - 博客园 (cnblogs.com) async Task 语法糖出来后,异步编程变得非常简单,适合需要耗费较长时间的任务. 有些小伙伴使用后可能会非常 ...

  4. java课堂测试2第一阶段:方法运用

    package test2; import java.util.*; public class Test2 { public static int generateRandom(int fanwei) ...

  5. 洛谷4172 WC2006水管局长(LCT维护最小生成树)

    这个题和魔法森林感觉有很相近的地方啊 同样也是维护一个类似最大边权最小的生成树 但是不同的是,这个题是有\(cut\)和询问,两种操作.... 这可如何是好啊? 我们不妨倒着来考虑,假设所有要\(cu ...

  6. 如何配置log4Net

    之前曾经用过几次,但是每次都是用完就忘了,下次再用的时候要baidu半天,这次弄通之后直接记下来. 步骤如下. 1. 安装log4Net,直接用NuGet, Install-Package log4N ...

  7. [Beta]the Agiles Scrum Meeting 9

    会议时间:2020.5.24 21:00 1.每个人的工作 今天已完成的工作 成员 已完成的工作 issue yjy 撰写技术博客 tq 实现评测机获取评测状态功能 评测部分增加更多评测指标 wjx ...

  8. BUAA软件工程个人项目作业

    BUAA软件工程个人项目作业 项目 内容 这个作业属于哪个课程 2020春季计算机学院软件工程(罗杰 任健) 这个作业的要求在哪里 个人项目作业 我在这个课程的目标是 学习软件开发的流程 这个作业在哪 ...

  9. Golang通脉之并发初探

    并发是编程里面一个非常重要的概念,Go语言在语言层面天生支持并发. 并发与并行 并发:同一时间段内执行多个任务. 并行:同一时刻执行多个任务,有时间上的重叠. 进程.线程.协程 进程(Process) ...

  10. HCNP Routing&Switching之BGP路由属性和优选规则

    前文我们了解了BGP防环机制和路由聚合相关话题,回顾请参考https://www.cnblogs.com/qiuhom-1874/p/15458110.html:今天我们来聊一聊BGP路由属性和选路规 ...