现代OpenGL渲染管线介绍
现代OpenGL渲染管线介绍
此文对最新的OpenGL做一个简单的介绍,如有理解错误,敬请指正。英文原文:
https://glumpy.github.io/modern-gl.html
opengl已经发展了很多年,自从2003年后提出dynamic pipeline(OpenGL 2.0)后发生了重大变化,例如 shader的使用允许直接对GPU操作
在这个版本之前,OpenGL使用固定管线(fixed pipeline),现在仍旧可以找到很多使用固定管线的手册,这篇文件将介绍OpenGL编程方式上的巨变,会使得OpenGL编程更难,但是却更强大。
Shaders
[备注:Shader语言乘坐glsl,从1.0到1.5有很多版本,后来的版本就继承OpenGL的版本号,最近的版本是4.4(2014年2月)]
Shaders是一段程序(使用类C语法)在GPU上build并且在rendering pipeline的时候被执行,根据shader的特性,在rendering pipeline的不同阶段被使用,简化流程的话,我们仅仅使用vertext shader和fragment shader,如下图:
vertex shader作用于顶点,在viewport上输出顶点位置,fragment shader作用于像素级别,用来输出每个像素的颜色,因此,一个简单的vertex shader大概是这样的:
void main()
{
gl_Position = vec4(0.0,0.0,0.0,1.0);
}
一个简单的fragment shader是这样的
void main()
{
gl_FragColor = vec4(0.0,0.0,0.0,1.0);
}
上面这两段shader没什么用,因为第一个将所有顶点转换为原点,第二个将屏幕所有像素输出为黑色,后面会看到如何使他们做更有用的事情。
还有一个问题:这些shader具体什么时候执行,vertex shader在每个顶点给到rendering pipeline的时候作用于每个顶点(后面会看到这是什么意思),fragment shader在vertex shader之后作用于每个像素,例如上面的图中,vertex shader将会执行3次,对每一个顶点(标注中的1,2,3顶点),fragment shader将会执行21次,每次作用于一个像素。
经过vertex shader后的顶点在primitive Generation(图元装配),OpenGL支持三种基本图元:点,线,三角形,接着对装配好的图元进行裁剪(clip),保留在视椎中的图元,丢弃不在视椎中的图元,对一半在视椎,一半不在视椎的图元进行裁剪,接着再对视椎中的图元进行剔除操作(cull)
对fragment shader的输出的每个片元进行一系列测试与处理,从而决定最终用于渲染的像素:
• Pixel ownership test:该测试决定像素在 framebuffer 中的位置是不是为当前 OpenGL
ES 所有。也就是说测试某个像素是否对用户可见或者被重叠窗口所阻挡。
• Scissor test:判断像素是否在由 glScissor 定义的剪裁矩形内,不在该剪裁区域内的像素就
会被剪裁掉
• Alpha test [DX9]在于Scissor test后面阶段,对输出的颜色进行是否透明的测试。
• Stencil Test:模版测试,将模版缓存中的值与一个参考值进行比较,从而进行相应的处理。
• Deph test:深度测试,比较下一个片段与帧缓冲区中的片段的深度,从而决定哪个像素在前,哪个像素被遮挡。在一些渲染管线中(移动平台),深度测试会提前到光栅化之前。
• Blend:将片段的颜色和帧缓冲区中已有的颜色值进行混合,并将混合所得的新值写入帧缓冲, Alpha Blend[directx9]。
• Dithering:使用有限的色彩让你看到比实际图象更多色彩的显示方式,以缓解表示颜色的值的精度不够大而导致的颜色剧变的问题。
• Framebuffer:这是流水线的最后一个阶段,Framebuffer 中存储这可以用于渲染到屏幕或纹理中的像素值,也可以从Framebuffer 中读回像素值【RenderTexture】。
Rasterization
光栅化是将vs的输出的基本图元转换为二维的片元(fragment),就是能被渲染到屏幕的像素,包含像素的位置,颜色,纹理坐标等信息,这些值是经过顶点信息插值计算得到,输出的片元(fragment)被送入下一个阶段 fragment shader中处理
在这个阶段,会进行提前进行深度测试(earyly-z),将当前片元的深度值和framebuffer中的片元的深度值比较,深度值越小,表示越靠近摄像机,会被渲染在前面(一般情况下,也可以指定深度测试的默认值,ZTest共有七种值,Less LEqual Euqul NotEqual Greater GEqual Always)
early-z是GPU硬件流水线决定,通过early-z可以提前知道深度信息,避免不必要的fragment shader计算,从而提高性能。
Buffers
前面讲了vertex shader作用每个顶点,问题是这些顶点怎么来的?时下OpenGL的思路是将其存储到GPU缓存中,在渲染之前只用传输给GPU存储一次,做法是在CPU上构建buffer,然后把他们传输到GPU,如果你的数据没有变化,就不需要更新,这和早年的fixed pipeline有很大不同,fixed piplline会在每次rendering call的时候都把顶点数据传送给GPU(只有现实列表才存储在GPU中)【可能和GPU显存比早年大幅增加有关,当然时下OpenGL的做法,会在顶点发生变化的时候,每次draw call时将最新的顶点数据送给GPU刷新缓存】
但是顶点结构是什么样的呢?关于顶点结构OpenGL没有假定任何事情,你可以自由的使用,唯一的要求是所有的同一个buffer里的顶点都应该有相同的结构(可以有不同的内容),这个和fixed pipeline有很大不同,fixed pipeline方式中OpenGL会使用隐式固定顶点结构存储有很多复杂渲染的东西(比如投影,光照,法线等),现在,全靠自己了
好消息是 现在你可以自由的做任何你想做的事情
坏消息是 你得自己编写所有,甚至连基本的投影和光照
用一个简单的例子,一个顶点结构想存储位置position和color信息,用python的话最简单的方式使用使用numpy库结构化数组
data = numpy.zeros(4, dtype = [ ("position", np.float32, 3),
("color", np.float32, 4)] )
上面在CPU中创建了四个顶点的缓存,每一个顶点有一个位置信息(三个x,y,z坐标的浮点数)和一个颜色信息(四个浮点数,分别是红绿蓝和透明通道),上面使用了三个坐标来表示一个位置信息,如果我们在二维中可以使用两个数值,同样的对于color来说,如果不想使用透明通道,也可以使用三个数值来表示,当然对于四个定点来说无关重要,但是必须意识到如果顶点数据增加到成千上万就有影响了
Uniform,attribute,varying
至此,我们已经知道shaders和buffers,但是仍然需要解释他们是如果关联起来的,那么让我们再看下我们的CPU Buffer
data = numpy.zeros(4, dtype = [ ("position", np.float32, 2),
("color", np.float32, 4)] )
我们需要告诉vertex shader它将要处理的顶点数据,位置信息是一个有3个float的元组类型,颜色是有4个float的元组类型,这就是attributes精确的要表达的意思,让我们稍微改动下前面的vertex shader
attribute vec2 position;
attribute vec4 color;
void main()
{
gl_Position = vec4(position, 0.0, 1.0);
}
这个vertex shader现在期望一个顶点包含两个属性,一个叫做position,一个叫color,并且指定了这两个属性的类型,一个是vec2,一个是vec4(包含4个float的元组),即便我们标注了第一个属性叫position,这个属性还没有和numpy数组中真是的数据绑定,我们需要在程序中某一个时刻来做,并且不会自动绑定,需要自己来绑定。
提供给vertex shader的第二个类型信息是uniform,可以被认为是存储了一些常量数据(作用于所有的顶点),例如我们想让所有的顶点位置都缩放,就可以这样写
uniform float scale;
attribute vec2 position;
attribute vec4 color;
void main()
{
gl_Position = vec4(position*scale, 0.0, 1.0);
}
最后的类型是varying,用来在vertex shader和fragment shader中传递信息,如果我们想传递顶点颜色给fragment shader,就可以这样写
uniform float scale;
attribute vec2 position;
attribute vec4 color;
varying vec4 v_color;
void main()
{
gl_Position = vec4(position*scale, 0.0, 1.0);
v_color = color;
}
然后在fragment shader中,就这样写:
varying vec4 v_color;
void main()
{
gl_FragColor = v_color;
}
问题是fragment shader中v_color的值是多少,我们有3个顶点,21个像素,那么每个像素的颜色该是多少?
答案是三个顶点颜色的插值,插值使用每个像素到每一个顶点的距离信息来计算插值,要理解这是一个很重要的概念,任何varying数值都是顶点插值的,以此构成了基本项
如果有对应贴图,fragment shader会根据每个顶点的uv信息,从贴图中找到对应的贴图颜色。
Transformations
Projection matrix
首先我们要定义我们要看到什么,就是说我们需要顶一个viewing volum,使所有在volumn中(甚至物体的一半在voumn中)的物体都被渲染,而其外的物体不被渲染,如下图,黄色和红色的小球被渲染,而绿色的没有被渲染,也不会被看到
3D到2D的投影方式有很多,但是我们只使用透视投影(近大远小)和正交投影(平行投影,远方和近方的物体投影一样大),如上图
在老的openGL版本中,可以使用glFrustum和glOrtho来得到对应的矩阵。
根据投影方式的不同,使用下面两个投影矩阵
我们没必要在这里探究这两个矩阵是怎么构建的,只要说他们是3D世界标准矩阵就行,都是基于假定摄像机在(0,0,0)原点位置,并且朝向正前方(0,1)方向就可以。
对于透视投影,还有一个更容易操作的转换矩阵,不需要指定视椎上下左右面
fovy指定了视角,也就是视椎的夹角,aspect指定了屏幕的宽高比,这决定了x方向上的视野。
Model and view matirces
主要是下面三个转换矩阵的使用:
Model matirces: 把物体的本地坐标转换为世界坐标
View matirces:把物体从世界做标准换为摄像机坐标
Projection matrices:把摄像机坐标转换为屏幕坐标
现代OpenGL渲染管线介绍的更多相关文章
- OpenGL渲染管线
OpenGL渲染管线具有一系列顺序处理阶段.两个图形信息数据,顶点数据与像素数据,在管线中被处理.组合,最终写入帧缓存.注意,OpenGL可以将处理过的数据送回到你的程序中.(参考灰色区域) Open ...
- OpenGL: 渲染管线理论
http://blog.csdn.net/augusdi/article/details/19934463 学习着色器,并理解着色器的工作机制,就要对OpenGL的固定功能管线有深入的了解. 首先要知 ...
- OpenGL渲染管线(rendering pipeline)
OpenGL中的渲染管线包括:顶点着色器(vertex shader).细分着色器(里面包含两种:细分控制着色器和细分控制着色器)(tessellation shader).几何着色器.光栅化及片元着 ...
- 小强学渲染之OpenGL渲染管线详析
什么是OpenGL? OpenGL是一套图形硬件的软件API接口库,它直接和GPU交互,将3D场景渲染绘制到2D屏幕上.总结说,OpenGL的功能是将程序中定义的各种2D或3D模型绘制到帧缓存中,或者 ...
- opengl渲染管线梳理
opengl渲染管线梳理 http://www.cnblogs.com/zhanglitong/p/3238989.html 坐标系变换和矩阵 http://www.cppblog.com/guoji ...
- Android OpenGL ES 开发(一): OpenGL ES 介绍
简介OpenGL ES 谈到OpenGL ES,首先我们应该先去了解一下Android的基本架构,基本架构下图: 在这里我们可以找到Libraries里面有我们目前要接触的库,即OpenGL ES. ...
- Android OpenGL ES .介绍
引自:http://blog.csdn.net/hgl868/article/details/6971624 1. OpenGL ES 简介 Android 3D引擎采用的是OpenGL ES. ...
- Android OpenGL ES(一)OpenGL ES介绍
在学习Android OpenGL ES开发之前,你必须具备Java 语言开发经验和一些Android开发的基本知识,但并不需要有图形开发的经验,本教程也会涉及到一些基本的线性几何知识,如矢量,矩阵运 ...
- 图形渲染的大致过程和关于OpenGL渲染管线的一些零碎知识,openglpipeline,vao,vbo,ebo.
重要!!! OpenGL新人一枚,希望可以再此和大家分享有用的知识,少走弯路 文章会定期更新,把前面几段已经整理过的知识更完后,接下来每周至少会更两次. 文章如果有不对的,理解错误的地方,也非常希望在 ...
随机推荐
- Linux 基本概念 & 命令
0. Linux 理解 Linux 是一种操作系统,主要应用于服务器. Linux 性能稳定,其中的许多版本不收费(如CentOS),占用资源较少. 1. 命令行的状态 在 Linux 命令行下以上分 ...
- Android高级_第三方框架Xutils
xutils的功能主要包括有四个部分:(1)布局视图关联:(2)图片下载与缓存:(3)网络请求:(4)数据库: 1. 使用xutils进行视图注入: (1)在控件声明上方添加@ViewInject() ...
- 56_实现类似spring的可配置的AOP框架
> config.properties 配置文件 key=类名 > BeanFactory Bean工厂,负责得到bean getBean("xxx") &g ...
- linux安装mydumper软件包以及报错解决
今天使用mydumper命令从AWS上的RDS集群MYSQL数据库导出数据,发现Tidb官方提供的工具不太适合,所以就自己编译了一个来尝试一下,居然成功了. 首先我的系统是Centos7,并且已经安装 ...
- python第三十六课——2.迭代器对象
满足前提: 1).必须是一个可迭代对象 2).可以被next()所作用的 举例: generator... 高效的检测一个对象是否是迭代器对象 需要使用collections模块中的Iterator类 ...
- Swift: Associated Types--为什么协议使用关联类型而不是泛型
关联类型的形式为类型的引用进而进行约束提供了条件: 同时能够简化语法形式. Swift: Associated Types http://www.russbishop.net/swift-associ ...
- google浏览器window.onbeforeunload方法兼容问题
window.onbeforeunload方法在IE内核浏览器是有效的,但是在google浏览器中并不兼容,请教给位怎么在google浏览器中兼容window.onbeforeunload方法 采纳的 ...
- 对比flash与ajax哪个好?
Ajax的优势: (1)可搜索性 普通的文本网页会更有利于SEO.文本内容是搜索引擎容易检索的,而繁琐的swf字节码却是搜索引擎不愿触及的.虽然Google等一些大型的搜索引擎可以检索SWF内部的内容 ...
- ArcGIS 9.3下载,包含ArcGIS Desktop、ArcGIS Engine、ArcGIS Server、ArcSDE、workstation
KeyWord:ESRI ArcGIS 9.3 Desktop Server Engine ArcEngine ArcIMS ArcSDE Workstation ECP Lisence Crack ...
- Underscore.js 入门-常用方法介绍
Underscore.js是一个很精干的库,压缩后只有4KB.它提供了几十种函数式编程的方法,弥补了标准库的不足,大大方便了JavaScript的编程.MVC框架Backbone.js就将这个库作为自 ...