现代OpenGL渲染管线介绍

此文对最新的OpenGL做一个简单的介绍，如有理解错误，敬请指正。英文原文：

https://glumpy.github.io/modern-gl.html

opengl已经发展了很多年，自从2003年后提出dynamic pipeline（OpenGL 2.0）后发生了重大变化，例如 shader的使用允许直接对GPU操作

在这个版本之前，OpenGL使用固定管线（fixed pipeline）,现在仍旧可以找到很多使用固定管线的手册，这篇文件将介绍OpenGL编程方式上的巨变，会使得OpenGL编程更难，但是却更强大。

Shaders

[备注：Shader语言乘坐glsl,从1.0到1.5有很多版本，后来的版本就继承OpenGL的版本号，最近的版本是4.4（2014年2月）]

Shaders是一段程序（使用类C语法）在GPU上build并且在rendering pipeline的时候被执行，根据shader的特性，在rendering pipeline的不同阶段被使用，简化流程的话，我们仅仅使用vertext shader和fragment shader，如下图：

vertex shader作用于顶点，在viewport上输出顶点位置，fragment shader作用于像素级别，用来输出每个像素的颜色，因此，一个简单的vertex shader大概是这样的：

void main()
{
gl_Position = vec4(0.0,0.0,0.0,1.0);
}

一个简单的fragment shader是这样的

void main()
{
gl_FragColor = vec4(0.0,0.0,0.0,1.0);
}

上面这两段shader没什么用，因为第一个将所有顶点转换为原点，第二个将屏幕所有像素输出为黑色，后面会看到如何使他们做更有用的事情。

还有一个问题：这些shader具体什么时候执行，vertex shader在每个顶点给到rendering pipeline的时候作用于每个顶点（后面会看到这是什么意思），fragment shader在vertex shader之后作用于每个像素，例如上面的图中，vertex shader将会执行3次，对每一个顶点（标注中的1,2,3顶点），fragment shader将会执行21次，每次作用于一个像素。

经过vertex shader后的顶点在primitive Generation（图元装配），OpenGL支持三种基本图元：点，线，三角形，接着对装配好的图元进行裁剪（clip）,保留在视椎中的图元，丢弃不在视椎中的图元，对一半在视椎，一半不在视椎的图元进行裁剪，接着再对视椎中的图元进行剔除操作（cull）

对fragment shader的输出的每个片元进行一系列测试与处理，从而决定最终用于渲染的像素:

• Pixel ownership test：该测试决定像素在 framebuffer 中的位置是不是为当前 OpenGL

ES 所有。也就是说测试某个像素是否对用户可见或者被重叠窗口所阻挡。

• Scissor test:判断像素是否在由 glScissor 定义的剪裁矩形内，不在该剪裁区域内的像素就

会被剪裁掉

• Alpha test [DX9]在于Scissor test后面阶段，对输出的颜色进行是否透明的测试。

• Stencil Test：模版测试，将模版缓存中的值与一个参考值进行比较，从而进行相应的处理。

• Deph test:深度测试，比较下一个片段与帧缓冲区中的片段的深度，从而决定哪个像素在前，哪个像素被遮挡。在一些渲染管线中（移动平台），深度测试会提前到光栅化之前。

• Blend:将片段的颜色和帧缓冲区中已有的颜色值进行混合，并将混合所得的新值写入帧缓冲， Alpha Blend[directx9]。

• Dithering：使用有限的色彩让你看到比实际图象更多色彩的显示方式，以缓解表示颜色的值的精度不够大而导致的颜色剧变的问题。

• Framebuffer：这是流水线的最后一个阶段，Framebuffer 中存储这可以用于渲染到屏幕或纹理中的像素值，也可以从Framebuffer 中读回像素值【RenderTexture】。

Rasterization

光栅化是将vs的输出的基本图元转换为二维的片元（fragment），就是能被渲染到屏幕的像素，包含像素的位置，颜色，纹理坐标等信息，这些值是经过顶点信息插值计算得到，输出的片元（fragment）被送入下一个阶段 fragment shader中处理

在这个阶段，会进行提前进行深度测试（earyly-z），将当前片元的深度值和framebuffer中的片元的深度值比较，深度值越小，表示越靠近摄像机，会被渲染在前面（一般情况下，也可以指定深度测试的默认值，ZTest共有七种值，Less LEqual Euqul NotEqual Greater GEqual Always）

early-z是GPU硬件流水线决定，通过early-z可以提前知道深度信息，避免不必要的fragment shader计算，从而提高性能。

Buffers

前面讲了vertex shader作用每个顶点，问题是这些顶点怎么来的？时下OpenGL的思路是将其存储到GPU缓存中，在渲染之前只用传输给GPU存储一次，做法是在CPU上构建buffer，然后把他们传输到GPU，如果你的数据没有变化，就不需要更新，这和早年的fixed pipeline有很大不同，fixed piplline会在每次rendering call的时候都把顶点数据传送给GPU（只有现实列表才存储在GPU中）【可能和GPU显存比早年大幅增加有关，当然时下OpenGL的做法，会在顶点发生变化的时候，每次draw call时将最新的顶点数据送给GPU刷新缓存】

但是顶点结构是什么样的呢？关于顶点结构OpenGL没有假定任何事情，你可以自由的使用，唯一的要求是所有的同一个buffer里的顶点都应该有相同的结构（可以有不同的内容），这个和fixed pipeline有很大不同，fixed pipeline方式中OpenGL会使用隐式固定顶点结构存储有很多复杂渲染的东西（比如投影，光照，法线等），现在，全靠自己了

好消息是现在你可以自由的做任何你想做的事情

坏消息是你得自己编写所有，甚至连基本的投影和光照

用一个简单的例子，一个顶点结构想存储位置position和color信息，用python的话最简单的方式使用使用numpy库结构化数组

data = numpy.zeros(4, dtype = [ ("position", np.float32, 3),
("color", np.float32, 4)] )

上面在CPU中创建了四个顶点的缓存，每一个顶点有一个位置信息（三个x,y,z坐标的浮点数）和一个颜色信息（四个浮点数，分别是红绿蓝和透明通道），上面使用了三个坐标来表示一个位置信息，如果我们在二维中可以使用两个数值，同样的对于color来说，如果不想使用透明通道，也可以使用三个数值来表示，当然对于四个定点来说无关重要，但是必须意识到如果顶点数据增加到成千上万就有影响了

Uniform,attribute,varying

至此，我们已经知道shaders和buffers，但是仍然需要解释他们是如果关联起来的，那么让我们再看下我们的CPU Buffer

data = numpy.zeros(4, dtype = [ ("position", np.float32, 2),
("color", np.float32, 4)] )

我们需要告诉vertex shader它将要处理的顶点数据，位置信息是一个有3个float的元组类型，颜色是有4个float的元组类型,这就是attributes精确的要表达的意思，让我们稍微改动下前面的vertex shader

attribute vec2 position;
attribute vec4 color;
void main()
{
gl_Position = vec4(position, 0.0, 1.0);
}

这个vertex shader现在期望一个顶点包含两个属性，一个叫做position，一个叫color，并且指定了这两个属性的类型，一个是vec2,一个是vec4（包含4个float的元组），即便我们标注了第一个属性叫position，这个属性还没有和numpy数组中真是的数据绑定，我们需要在程序中某一个时刻来做，并且不会自动绑定，需要自己来绑定。

提供给vertex shader的第二个类型信息是uniform，可以被认为是存储了一些常量数据（作用于所有的顶点），例如我们想让所有的顶点位置都缩放，就可以这样写

uniform float scale;
attribute vec2 position;
attribute vec4 color;
void main()
{
gl_Position = vec4(position*scale, 0.0, 1.0);
}

最后的类型是varying,用来在vertex shader和fragment shader中传递信息，如果我们想传递顶点颜色给fragment shader，就可以这样写

uniform float scale;
attribute vec2 position;
attribute vec4 color;
varying vec4 v_color;

void main()
{
gl_Position = vec4(position*scale, 0.0, 1.0);
v_color = color;
}

然后在fragment shader中，就这样写：

varying vec4 v_color;

void main()
{
gl_FragColor = v_color;
}

问题是fragment shader中v_color的值是多少，我们有3个顶点，21个像素，那么每个像素的颜色该是多少？

答案是三个顶点颜色的插值，插值使用每个像素到每一个顶点的距离信息来计算插值，要理解这是一个很重要的概念，任何varying数值都是顶点插值的，以此构成了基本项

如果有对应贴图，fragment shader会根据每个顶点的uv信息，从贴图中找到对应的贴图颜色。

Transformations

Projection matrix

首先我们要定义我们要看到什么，就是说我们需要顶一个viewing volum，使所有在volumn中（甚至物体的一半在voumn中）的物体都被渲染，而其外的物体不被渲染，如下图，黄色和红色的小球被渲染，而绿色的没有被渲染，也不会被看到

3D到2D的投影方式有很多，但是我们只使用透视投影（近大远小）和正交投影（平行投影，远方和近方的物体投影一样大），如上图

在老的openGL版本中，可以使用glFrustum和glOrtho来得到对应的矩阵。

根据投影方式的不同，使用下面两个投影矩阵

我们没必要在这里探究这两个矩阵是怎么构建的，只要说他们是3D世界标准矩阵就行，都是基于假定摄像机在（0，0,0）原点位置，并且朝向正前方（0,1）方向就可以。

对于透视投影，还有一个更容易操作的转换矩阵，不需要指定视椎上下左右面

fovy指定了视角，也就是视椎的夹角，aspect指定了屏幕的宽高比，这决定了x方向上的视野。

Model and view matirces

主要是下面三个转换矩阵的使用：

Model matirces: 把物体的本地坐标转换为世界坐标

View matirces:把物体从世界做标准换为摄像机坐标

Projection matrices:把摄像机坐标转换为屏幕坐标

现代OpenGL渲染管线介绍的更多相关文章

OpenGL渲染管线
OpenGL渲染管线具有一系列顺序处理阶段.两个图形信息数据,顶点数据与像素数据,在管线中被处理.组合,最终写入帧缓存.注意,OpenGL可以将处理过的数据送回到你的程序中.(参考灰色区域) Open ...
OpenGL: 渲染管线理论
http://blog.csdn.net/augusdi/article/details/19934463 学习着色器,并理解着色器的工作机制,就要对OpenGL的固定功能管线有深入的了解. 首先要知 ...
OpenGL渲染管线（rendering pipeline）
OpenGL中的渲染管线包括:顶点着色器(vertex shader).细分着色器(里面包含两种:细分控制着色器和细分控制着色器)(tessellation shader).几何着色器.光栅化及片元着 ...
小强学渲染之OpenGL渲染管线详析
什么是OpenGL? OpenGL是一套图形硬件的软件API接口库,它直接和GPU交互,将3D场景渲染绘制到2D屏幕上.总结说,OpenGL的功能是将程序中定义的各种2D或3D模型绘制到帧缓存中,或者 ...
opengl渲染管线梳理
opengl渲染管线梳理 http://www.cnblogs.com/zhanglitong/p/3238989.html 坐标系变换和矩阵 http://www.cppblog.com/guoji ...
Android OpenGL ES 开发（一）: OpenGL ES 介绍
简介OpenGL ES 谈到OpenGL ES,首先我们应该先去了解一下Android的基本架构,基本架构下图: 在这里我们可以找到Libraries里面有我们目前要接触的库,即OpenGL ES. ...
Android OpenGL ES .介绍
引自:http://blog.csdn.net/hgl868/article/details/6971624 1. OpenGL ES 简介 Android 3D引擎采用的是OpenGL ES. ...
Android OpenGL ES（一）OpenGL ES介绍
在学习Android OpenGL ES开发之前,你必须具备Java 语言开发经验和一些Android开发的基本知识,但并不需要有图形开发的经验,本教程也会涉及到一些基本的线性几何知识,如矢量,矩阵运 ...
图形渲染的大致过程和关于OpenGL渲染管线的一些零碎知识，openglpipeline，vao，vbo，ebo.
重要!!! OpenGL新人一枚,希望可以再此和大家分享有用的知识,少走弯路文章会定期更新,把前面几段已经整理过的知识更完后,接下来每周至少会更两次. 文章如果有不对的,理解错误的地方,也非常希望在 ...

随机推荐

Servlet_Struts2
百度云链接:https://pan.baidu.com/s/1TNkQ8KN2t1xJFcf_CnTXDQ 密码:i3w8 修改中...
Eclipse中Tomcat的配置
1.Window-Preferences-Server-Runtime Environments 2.点击Add,选择相应的Tomcat版本,我的是7.0的所以我选择这个.并勾选Create a ne ...
Redis-安装时问题整理
一.Redis编译: 1.问题:make gcc error yum –y install gcc 2.问题:安装报错 error: jemalloc/jemalloc.h: No such file ...
NoSQL——not onlySQL不仅仅是SQL
数据有很大一部分是由关系数据库管理系统(RDBMS)来处理. 1970年 E.F.Codd's提出的关系模型的论文 "A relational model of data for large ...
Linux设置口令复杂度和口令定期更换策略
Linux 密码复杂度设置pam_pwquality.pam_passwdqc(centos7) 1.Linux对应的密码策略模块有:pam_passwdqc 和 pam_pwquality . 其中 ...
利用 Settings Sync 同步vs code配置
vs code上有各种各样不同的插件,如果要在不同的电脑上使用 vs code 配置是件比较麻烦的事情,使用 Settings Sync 将 vs code 配置备份起来,当需要在其他电脑使用 vs ...
centos7之Java开发环境构建
CensOS7环境我个人的博客环境如下: 希望这个教程可以帮助到linux新手朋友们或者其他在安装软件时遇到问题的朋友们当然了,百度上也有很多类似这样的教程,我个人贴出来,一来为分享,二来以后自己 ...
std::max、std::min error C2589: “(”:“::”右边的非法标记，error C2059: 语法错误:“::”
在VC++种同时包含头文件#include <windows.h>和#include <algorithm>后就会出现无法正常使用std标准库中的min和max模板函数,经过查 ...
OpenCV——输入输出XML和YAML文件
Python2.7-filecmp
filecmp 模块,定义了比较文件或目录的函数,比较文件只会有 True 和 False 两种结果,比较目录会返回目录下相同的文件,不同的文件,出错的文件.比较文件也可以用 difflib 模块,d ...

现代OpenGL渲染管线介绍

现代OpenGL渲染管线介绍

现代OpenGL渲染管线介绍的更多相关文章

随机推荐

热门专题