Unity运用GPU代替CPU处理和计算简单测试

http://www.manew.com/thread-110502-1-1.html

随着游戏玩法的增强，计算的多量化，我们的CPU并不足以迅速的处理这些问题，而Unity给我们开放了一个接口，我们需要用它来处理大量的运算；

我们可以把大量的处理运算的逻辑放入这个Shader中，用GPU的并行能力来计算，这里简单的说一说他的使用方式和如何把参数传入和传出。让我们像一个方法一样调用。

首先：在Unity中我们可以创建一个ComputeShader：

<ignore_js_op>

打开之后会发现一个这样的脚本：

<ignore_js_op>

简单的介绍一下，

1、这个#pragmakernel Multiply 这是一个内核，也可以称作入口。这个至少有一个！

这个Multiply请红线标注，很重要，我们在代码里需要用到它；

2、接下来就是一个结构体，这个结构体是我们定义的一个结构体。我们用它来和外面的结构体相呼应。

3、RwStructuredBuffer<VecMatpair>dataBuffer 相当于我们声明的一个可读写的变量我用C#表示： VecMatPair[] dataBuffer；

4、就是方法主体，跟第一条呼应，外部会调用这个类似于Main函数的方法；可以写一些简单的逻辑，给上面的变量赋值：（这里值得重点一说，这个变量又当输入又当输出，注意！）；

这里我们的ComputeShader也就构建完成了；

下面进行C#的编写，让其呼应，传入和输出；

<ignore_js_op>

1、我们需要定义一个和Shader里面呼应的结构体。

2、获取这个shader，我们直接拖入就OK；

然后变量基本就完事了：

我们看一下代码主体：

<ignore_js_op>

除去单行符号，我们一行一行解释，千万别乱：

1、声明一个长度为15的结构体，这是我们的输入参数；（然而并用不到15个）

2、制定一个循环，我给他了一个赋值，都是相同的值；

循环体里的内容跳过；

3、这个很重要，还记得让你们标红线的地方吗。这个就是获取这个入口的标识；

4、下面这个数组结构，用来最后来收取需要的5个数据；

5、这里是测试打印跳过；

6、 ComputeBuffer 这个也很重要，你还需要声明一个Buffer 参数需要制定这个收取的长度，和这个数组的所有占用字节（提前计算（这里就是Float=4 因为是2个Float=8 又因为是个长度为5的数组=5*8=40 ））；

7、下面就是一套流程了，对，就是走走流程；

关联这个数据结构和Shader的变量相关联；

SetData（）把需要传入的数据送进Shader；

接着！重点，一定要运行，第一开始我写完发现怎么都没变化，一定要运行Shader；Dispatch（）；

最后收取返回数据（我们需要接收这40个字节的数据）；

打印结果附图：

<ignore_js_op>

Unity运用GPU代替CPU处理和计算简单测试的更多相关文章

Unity 渲染流水线：CPU与GPU合作创造的艺术wfd
前言对于Unity渲染流程的理解可以帮助我们更好对Unity场景进行性能消耗的分析,进而更好的提升场景渲染的效率,最后提升游戏整体的性能表现 Unity的游戏画面的最终的呈现是由CPU与GPU相互配 ...
unity优化-GPU(网上整理)
优化-GPUGPU与CPU不同,所以侧重点自然也不一样.GPU的瓶颈主要存在在如下的方面: 填充率,可以简单的理解为图形处理单元每秒渲染的像素数量.像素的复杂度,比如动态阴影,光照,复杂的shader ...
gpu和cpu区别
GPU的功耗远远超过CPUCache, local memory: CPU > GPU Threads(线程数): GPU > CPURegisters: GPU > CPU 多寄存 ...
GPU、CPU的异同
一.概念 CPU(Center Processing Unit)即中央处理器,GPU(Graphics Processing Unit)即图形处理器. 二.CPU和GPU的相同之处两者都有总线和外界 ...
iOS GPU、cpu、显示器的协作
在 iOS 系统中,图像内容展示到屏幕的过程需要 CPU 和 GPU 共同参与. CPU 负责计算显示内容,比如视图的创建.布局计算.图片解码.文本绘制等. 随后 CPU 会将计算好的内容提交到 GP ...
GPU与CPU
GPU与CPU CPU CPU,也就是中央处理器,结构主要包括控制器(指挥各部分工作).运算器(实现数据加工).寄存器.高缓以及数据/控制/状态总线.计算机的性能很大程度上依赖于CPU,CPU的功能包 ...
使用PCAST检测散度以比较GPU和CPU结果
使用PCAST检测散度以比较GPU和CPU结果并行编译器辅助软件测试(PCAST)是英伟达HPC FORTRAN.C++和C编译器中的一个特性.PCAST有两个用例.一个新的处理器或新的编译程序的部 ...
Python的GPU编程实例——近邻表计算
技术背景 GPU加速是现代工业各种场景中非常常用的一种技术,这得益于GPU计算的高度并行化.在Python中存在有多种GPU并行优化的解决方案,包括之前的博客中提到的cupy.pycuda和numba ...
聊聊GPU与CPU的区别
目录前言 CPU是什么? GPU是什么? GPU与CPU的区别 GPU的由来并行计算 GPU架构优化 GPU和CPU的应用场景作者:小牛呼噜噜 | https://xiaoniuhululu.c ...

随机推荐

20145218张晓涵 PC平台逆向破解_advanced
---恢复内容开始--- 20145218张晓涵 PC平台逆向破解_advanced shellcode注入基础知识 shellcode就是在利用溢出攻击溢出时要值入的代码,也就是溢出后去执行的代码 ...
MySQL事务在MGR中的漫游记—路线图
欢迎访问网易云社区,了解更多网易技术产品运营经验. MGR即MySQL Group Replication,是MySQL官方推出的基于Paxos一致性协议的数据高可靠.服务高可用方案.MGR在20 ...
使用C/C++代码编写Python模块
假如我们要用C语言实现下面的python脚本bird.py import os def fly(name): print(name + " is flying.\n") 调用脚本m ...
【转】C#工程连接oracle的一种方式
源地址:https://blog.csdn.net/qq_16542775/article/details/52689068 项目中有个功能需要从一台Oracle数据库获取数据,本以为是很简单的事情, ...
const 迭代器和 const_iterator (vector/set/map)
vector: 如同一般复合类型一样,vector 迭代器也可以声明成: const vector<int>::iterator it1 = v.begin(); vector<in ...
题解 UVA10212 【The Last Non-zero Digit.】
题目链接这题在学长讲完之后和看完题解之后才明白函数怎么构造. 这题构造一个$f(n)$ $f(n)$ $=$ $n$除以 $2^{a}$ $*$ $5^{b}$ ,$a$ , $b$ 分别是 $n$ ...
洛谷P4502 [ZJOI2018]保镖（计算几何+三维凸包）
题面传送门题解我对计蒜几盒一无所知顺便$xzy$巨巨好强前置芝士三维凸包啥?你不会三维凸包?快去把板子写了->这里欧拉公式 \[V-E+F=2\] $V:vertex$顶 ...
洛谷P1251 餐巾计划问题（费用流）
传送门不得不说这题真是思路清奇,真是网络流的一道好题,完全没想到网络流的建图还可以这么建我们把每一个点拆成两个点,分别表示白天和晚上,白天可以得到干净的餐巾(购买的,慢洗的,快洗的),晚上可以得到 ...
JS内置对象的原型不能重定义？只能动态添加属性或方法？
昨天马上就快下班了,坐在我对面的同事突然问我一个问题,我说“爱过”,哈哈,开个玩笑.情况是这样的,他发现JS的内置对象的原型好像不能通过字面量对象的形式进行覆盖, 只能动态的为内置对象的原型添加属性或 ...
Unity---动画系统学习(3)---使用状态机来实现走、跑、转弯等的动画切换
1. 初始设置用动画学习笔记(2)中方法,把动画全都切割好. 拖进状态机并设置箭头.并设置具体箭头触发的事件. 在状态机左侧中添加参数,Float和Int类型参数只能从-1~1之间变化 Float: ...

Unity运用GPU代替CPU处理和计算简单测试

Unity运用GPU代替CPU处理和计算简单测试的更多相关文章

随机推荐

热门专题