再谈vbo
我们之前都是通过glNamedBufferData初始化buffer object,初始化的意思是为buffer object开辟显存空间,并填充数据:
GLfloat position[] =
{
-1.0f, -1.0f,
0.0f, 1.0f,
1.0f, -1.0f,
};
GLuint vbo = 0;
glCreateBuffers(1, &vbo);
glNamedBufferData(vbo, sizeof(position), position, GL_STATIC_DRAW);
...
drawTriangle();
glNamedBufferData一个比较方便的地方就是,如果我们在drawTriangle()完成之后还想再绘制一个方形,可以复用这个vbo。
... //after drawing triangle
GLfloat position[] =
{
-0.5f, 0.5f,
-0.5f, -0.5f,
0.5f, 0.5f,
0.5f, -0.5f,
};
glNamedBufferData(vbo, 8 * sizeof(GLfloat), position, GL_STATIC_DRAW); //只能等drawTriangle完成之后才能执行
...
drawRect();
一个buffer object可以复用很多次,但是不推荐这么做。因为这样会降低GPU的并行力度,起码我们可以推断:glNamedBufferData(vbo, 8 * sizeof(GLfloat), position, GL_STATIC_DRAW)要等待drawTriangle()完成之后才能执行。有经验的OpenGL程序员都会创建两个VBO完成这两次render操作。
但是我想表达的是:对于同一个buffer object,可以多次调用glNamedBufferData为它重新分配空间和指定usage。
那有没有一种API,一旦初始化完buffer object之后,其size和usage就不得发生改变呢?有,它就是我们今天要讲的glNamedBufferStorage。
glNamedBufferStorage
先看一下这个命令的原型:
void glNamedBufferStorage(GLuint buffer,
GLsizeiptr size,
const void *data,
GLbitfield flags);
前三个参数与glNamedBufferData相同,最后一个参数是以位组合来表达此buffer的usage,它的值可能是以下标识位组合:
- GL_DYNAMIC_STORAGE_BIT
- GL_MAP_READ_BIT
- GL_MAP_WRITE_BIT
- GL_MAP_PERSISTENT_BIT
- GL_MAP_COHERENT_BIT
我不会去机械的罗列出这些标识位的意思,因为那样会很无趣。我的理念是用到哪个东西,再讲哪个东西。
首先,再次明确一下,官方的说法是:一旦用glNamedBufferStorage为buffer object分配好空间并指定usage flag之后,该buffer object的size和usage flag就不能再发生改变,不过数据的内容倒是可以改变。
在我看来,这句话说的实在是太轻了,因为哪怕是这样代码:
//以相同的参数调用glNamedBufferStorage两次
glNamedBufferStorage(vbo, sizeof(trianglePosition), trianglePosition, 0);
glNamedBufferStorage(vbo, sizeof(trianglePosition), trianglePosition, 0);
OpenGL都会抱怨产生了一个错误:Cannot modify immutable buffer。
哇,您还不如和我说对于同一个buffer object,只能调用一次glNamedBufferStorage呢。不过这样的严格限制,带来的好处是:比起glNamedBufferData,glNamedBufferStorage能够带来更好的性能。而且glNamedBufferStorage的usage flag参数更加现代化,准确的判断usage flag参数,对于性能的优化以及程序的正确执行都至关重要。比如你调用了glNamedBufferStorage为某个buffer object开辟了空间并初始化了其中的数据,之后你再也不想对这个buffer object进行读取或者写入,那么就可以把usage flag设置为0,这将带来最好的性能优化。
但是如果我们还想修改这个buffer object中的数据,或者是想把buffer object中的数据读取至内存,该怎么办呢?
读取buffer中的数据
在把buffer object的usage设置为0的情况下,我们可以调用glNamedBufferSubData来读取buffer中的数据:
glNamedBufferStorage(vbo, sizeof(trianglePosition), trianglePosition, 0); //最后一个参数设置为0
...
glGetNamedBufferSubData(vbo, 0, 9*sizeof(GLfloat), positionPointer);
这样,vbo中的数据就会从显存映射到positionPointer指向的内存空间。
不过这里还是有一个小细节:调用glNamedBufferStorage之后,OpenGL告诉我这个buffer object的usage hint是GL_STATIC_DRAW,然后我们在某个时机再调用glGetNamedBufferSubData之后,OpenGL就会告诉我这个buffer object的usage hint是GL_DYNAMIC_DRAW。我们都知道GL_STATIC_DRAW是要比GL_DYNAMIC_DRAW的性能更好。
向buffer中写入数据
我们可以调用glNamedBufferSubData来向buffer object中写入数据:
glNamedBufferSubData(vbo, 0, 9*sizeof(GLfloat), newTrianglePoints);
不过,初始化buffer object的时候,要把usage设置为GL_DYNAMIC_STORAGE_BIT
glNamedBufferStorage(vbo, sizeof(trianglePosition), trianglePosition, GL_DYNAMIC_STORAGE_BIT);
而且,与"读取buffer中的数据"中得到的结论一致:调用glNamedBufferSubData之后,OpenGL也会告诉我buffer object的usage hint是GL_DYNAMIC_DRAW。
所以各位同学,哥哥奉劝你们:使用glNamedBufferStorage初始化buffer object空间之后,尽量就不要再对buffer object进行读写了吧。
我尝试过把usage设置为0,然后向buffer写入数据:
glNamedBufferStorage(vbo, sizeof(trianglePosition), trianglePosition, 0);
...
glNamedBufferSubData(vbo, 0, 9*sizeof(GLfloat), newTrianglePoints);
OpenGL又告诉我发生了一个错误: Buffer contents cannot be modified because the buffer was created without the GL_DYNAMIC_STORAGE_BIT set。虽然尽可能精简usage flag是一个好习惯,不过前提还是要保证程序的正确性。
另外,虽然glNamedBufferSubData看起来与glNamedBufferData有点像,但是它们确实不是同一类API。
glNamedBufferData和glNamedBufferStorage算是同一类API,而glNamedBufferSubData是配合glNamedBufferStorage使用的。
glMapNamedBufferRange
在早期的OpenGL,我们可以使用glMapBuffer和glUnmapBuffer来读写buffer object的数据。modern OpenGL有更为高级的API来做这件事:
void *glMapNamedBufferRange(GLuint buffer,
GLintptr offset,
GLsizeiptr length,
GLbitfield access);
此君与glMapNamedBuffer相比,有两个优点:
- 能够将buffer object的一部分(而非全部)数据映射到内存空间。
- 能够以位组合的形式描述访问策略,
access参数必须与glNamedBufferStorage的usage配合起来使用。
比如我想读取三角形的顶点位置buffer中的数据,然后进行射线求交:
GLfloat position[] =
{
...
};
glNamedBufferStorage(vbo, 9 * sizeof(GLfloat), position, GL_MAP_READ_BIT); //初始化buffer时,usage flag要包含GL_MAP_READ_BIT才能读取buffer的内容
...
GLfloat* trianglePosition = (GLfloat*)glMapNamedBufferRange(vbo, 0, 9 * sizeof(GLfloat), GL_MAP_READ_BIT);//最后一个参数表示仅对buffer进行读操作
//射线求交的伪代码
Ray ray;
ray.intersectWithTriangle(trianglePosition);
GLboolean unMap = glUnmapNamedBuffer(vbo); //操作完成,告诉OpenGL我不会再使用trianglePosition指针指向的内容了
assert(unMap);
需要反复强调的:glNamedBufferStorage的usage flag参数要与glMapNamedBufferRange的access flag参数配合起来。
另外,当不再需要glMapNamedBufferRange返回的数据之后,应尽快进行glUnmapNamedBuffer。然后检查其返回值,在某些极端的情况下,可能会unmap失败。
当我进行读操作的时候,OpenGL没有通知我关于buffer的usage hint的消息。当我进行写操作的时候,OpenGL通知我此buffer的usage hint为GL_DYNAMIC_DRAW。
到底该使用哪个
既然glNamedBufferSubData(glGetNamedBufferSubData)和glMapNamedBufferRange都能读写buffer的数据,那问题来了,我们应该用哪个呢?
首先,glMapNamedBufferRange更具性能优势。我不去讲什么专业名词(譬如什么asynchronous DMA transfer之类的东东),仅从代码的角度来分析为什么glMapNamedBufferRange速度更快。
首先,我们为glNamedBufferSubData传入的指针所指向的内存空间是我们自己分配出来的。譬如:
GLfloat* trangleColor = new GLfloat[9];
for (int i = 0; i < 3; ++i)
{
for (int j = 0; j < 3; ++j)
trangleColor[i * 3 + j] = 1.0f;
}
glNamedBufferSubData(vbo, 0, sizeof(GLfloat) * 9, trangleColor);
delete[] trangleColor; //传输到buffer之后直接销毁
如上代码,OpenGL无法预料到开发者在调用完glNamedBufferSubData之后,怎么处理trangleColor指向的内存空间,比如我调用完glNamedBufferSubData之后直接销毁掉了这部分数据。所以OpenGL只能让CPU在glNamedBufferSubData先停下来,集中精力把triangleColor指向的内存空间的内容拷贝到显存空间,等glNamedBufferSubData返回之后(拷贝完成),才能继续往下执行。
而glMapNamedBufferRange返回内存空间是OpenGL自己管理的,当我们调用glUnmapNamedBuffer之后,可以立即返回,然后在比较闲的时候偷偷的执行拷贝操作,并且这个操作也可以与其它的命令并行执行。
所以如果只是很偶尔地读写的很小的数据量,两者区别可能没有那么明显。但是如果频繁的读写,或者一次读写的数据量很大,那么glMapNamedBufferRange glUnmapNamedBuffer的性能优势就非常明显了。
glMapNamedBufferRange还有一个优点,比如三角形的顶点数据存放到了磁盘的某个文件中,现在要用这个文件的顶点来创建vbo:
//使用glNamedBufferSubData
FILE* f = fopen("position.dat", "rb");
fseek(f, 0, SEEK_END);
long fileSize = std::ftell(f);
fseek(f, 0, SEEK_SET);
glNamedBufferStorage(vbo[0], fileSize, nullptr, GL_DYNAMIC_STORAGE_BIT);
GLchar* position = new GLchar[fileSize]; //申请内存空间用来存放文件的顶点数据
fread(position, 1, fileSize, f);
glNamedBufferSubData(vbo[0], 0, fileSize, position);
delete[] position;
fclose(f);
//使用glMapNamedBufferRange
FILE* f = fopen("position.dat", "rb");
fseek(f, 0, SEEK_END);
long fileSize = std::ftell(f);
fseek(f, 0, SEEK_SET);
glNamedBufferStorage(vbo[0], fileSize, nullptr, GL_MAP_WRITE_BIT);
void* data = glMapNamedBufferRange(vbo[0], 0, fileSize, GL_MAP_WRITE_BIT);
fread(data, 1, fileSize, f);
fclose(f);
glUnmapNamedBuffer(vbo[0]);
利用glMapNamedBufferRange就可以避免先把文件的内容拷贝到内存中这一步骤。
小结
- 推荐使用
glNamedBufferStorage初始化buffer object。 - 推荐使用
glMapNamedBufferRange glUnmapNamedBuffer读写buffer中的数据。
再谈vbo的更多相关文章
- Unity教程之再谈Unity中的优化技术
这是从 Unity教程之再谈Unity中的优化技术 这篇文章里提取出来的一部分,这篇文章让我学到了挺多可能我应该知道却还没知道的知识,写的挺好的 优化几何体 这一步主要是为了针对性能瓶颈中的”顶点 ...
- [转载]再谈百度:KPI、无人机,以及一个必须给父母看的案例
[转载]再谈百度:KPI.无人机,以及一个必须给父母看的案例 发表于 2016-03-15 | 0 Comments | 阅读次数 33 原文: 再谈百度:KPI.无人机,以及一个必须 ...
- Support Vector Machine (3) : 再谈泛化误差(Generalization Error)
目录 Support Vector Machine (1) : 简单SVM原理 Support Vector Machine (2) : Sequential Minimal Optimization ...
- 浅谈HTTP中Get与Post的区别/HTTP协议与HTML表单(再谈GET与POST的区别)
HTTP协议与HTML表单(再谈GET与POST的区别) GET方式在request-line中传送数据:POST方式在request-line及request-body中均可以传送数据. http: ...
- Another Look at Events(再谈Events)
转载:http://www.qtcn.org/bbs/simple/?t31383.html Another Look at Events(再谈Events) 最近在学习Qt事件处理的时候发现一篇很不 ...
- C++ Primer 学习笔记_32_STL实践与分析(6) --再谈string类型(下)
STL实践与分析 --再谈string类型(下) 四.string类型的查找操作 string类型提供了6种查找函数,每种函数以不同形式的find命名.这些操作所有返回string::size_typ ...
- 再谈JSON -json定义及数据类型
再谈json 近期在项目中使用到了highcharts ,highstock做了一些统计分析.使用jQuery ajax那就不得不使用json, 可是在使用过程中也出现了非常多的疑惑,比方说,什么情况 ...
- C++ Primer 学习笔记_44_STL实践与分析(18)--再谈迭代器【下】
STL实践与分析 --再谈迭代器[下] 三.反向迭代器[续:习题] //P355 习题11.19 int main() { vector<int> iVec; for (vector< ...
- C++ Primer 学习笔记_43_STL实践与分析(17)--再谈迭代器【中】
STL实践与分析 --再谈迭代器[中] 二.iostream迭代[续] 3.ostream_iterator对象和ostream_iterator对象的使用 能够使用ostream_iterator对 ...
随机推荐
- SparkSQL中产生笛卡尔积的几种典型场景以及处理策略
[前言:如果你经常使用Spark SQL进行数据的处理分析,那么对笛卡尔积的危害性一定不陌生,比如大量占用集群资源导致其他任务无法正常执行,甚至导致节点宕机.那么都有哪些情况会产生笛卡尔积,以及如何事 ...
- Dotnet洋葱架构实践
一个很清晰的架构实践,同时刨刨MySQL的坑. 一.洋葱架构简介 洋葱架构出来的其实有一点年头了.大约在2017年下半年,就有相关的说法了.不过,大量的文章在于理论性的讨论,而我们今天会用一个项目 ...
- P2142_高精度减法(JAVA语言)
思路:BigInteger double kill! //四行搞定 题目描述 高精度减法 输入输出格式 输入格式: 两个整数a,b(第二个可能比第一个大) 输出格式: 结果(是负数要输出负号) 输入输 ...
- P1149_火柴棒等式(JAVA语言)
题目描述 给你n根火柴棍,你可以拼出多少个形如"A+B=C"的等式?等式中的A.B.C是用火柴棍拼出的整数(若该数非零,则最高位不能是0).用火柴棍拼数字0-90−9的拼法如图所示 ...
- 在 .NET Core 中使用 ViewConfig 调试配置
介绍 .NET Core 中的配置包含了多个配置提供程序,包括了 appsettings.json,环境变量,命令行参数等,还有一些扩展的自定义提供程序,比如说 ApolloConfig,AgileC ...
- 第25 章 : Kubernetes 网络模型进阶
Kubernetes 网络模型进阶 本文将主要分享以下五个方面的内容: Kubernetes 网络模型来龙去脉 Pod 究竟如何上网? Service 究竟怎么工作? 啥?负载均衡还分内部外部? 思考 ...
- 创建逻辑卷,格式化为xfs格式化,在线扩容
创建逻辑卷,并且格式化为xfs格式化好,然后在线扩容 删除逻辑卷组
- 记一次go中map并发引起的事故
错误使用map引发的血案 前言 场景复原 原因 参考 错误使用map引发的血案 前言 最近业务中,同事使用map来接收返回的结果,使用waitGroup来并发的处理执行返回的结果,结果上线之后,直接崩 ...
- w1R3s靶机work_through
前言 这靶机挺简单的.虽然网友们有分享oscp向的靶机集,但是没有一个难度梯度,做起来就怪怪的. 打点 nmap -sP 192.168.218.0/24 发现主机IP 192.168.218.134 ...
- CentOS7 基本概念以及安装注意事项
什么是Linux发行版?发行版是什么意思? Linux本质上是操作系统内核,类似Chrome浏览器内核一样,Linux发行版CentOS.Redhat.Ubuntu等等都是基于Linux内核开发出来的 ...