http://www.opengpu.org/forum.php?mod=viewthread&tid=40&highlight=Attila
|
  
-
注冊时间
-
2007-6-9
-
积分
-
408
|
先上几张 ATTILA GPU Streamer Unit 的图(持续更新,呵呵。。。)
[ 本帖最后由 octane3d 于 2007-8-10 01:38 编辑 ] |
|
|
|
|
|
|
|
|
|
|

-
注冊时间
-
2007-8-3
-
积分
-
2
|
|
|
|
|
|
|
|
|
|
|

-
注冊时间
-
2007-9-10
-
积分
-
26
|
|
请问您的图是用什么软件画出来的,我就viso画的太丑了 |
|
|
|
|
|
|
|
|
|
|
   
-
注冊时间
-
2009-10-26
-
积分
-
1902
|
|
正在看Attila的论文,遗憾的是他们的学位论文都是Spanish |
|
|
公开促进交流;交流促进提高;上传资料坚持0阅读权限
|
|
|
|
|
|
|
|
 
-
注冊时间
-
2009-11-15
-
积分
-
156
|
|
闲聊一句,诚如IC.expert老大说,这东西距硬件太远了,可是我越来越认为它的设计思想有非常多能够借鉴的地方,模块的划分对于软件开发有非常好的參考价值(尤其对于model的设计),模块的内聚性非常高,对外的接口统一,利用signal的抽象巧妙的实现了非常多硬件的特性,比方bandwidth,latency,pipe机制.....自己去实现这样一套东西,是非常难的,在这一套框架的基础上,能够自由实现多种算法,是一个非常好的平台。 |
-
1
查看所有评分
-
|
|
|
|
|
|
|
|
|
|
 
-
注冊时间
-
2009-11-15
-
积分
-
156
|
|
IC老大,硬件,我一点不懂了,我的理解主要是基于软件的角度。当时是想了解下图形chip内部的运作流程,又苦于找不到资料,才粗略地看了看attila,你说的pipeline stage之间的耦合,是指什么,是否能详细讲讲,给俺们新手也普及下。呵呵 |
-
1
查看所有评分
-
|
|
|
|
|
|
|
|
|
|
 
-
注冊时间
-
2009-11-15
-
积分
-
156
|
多谢老大这么高速的回帖,明确了你的说意思了。老大是说一个单元(比方streamer unit)内部各个模块(streamer fetch, Loader, commit.....)之间的独立性不强。
attila在我看来定位应该是一个cmodel,而不是RTL model, 也就是说不是面向硬件实现的。我个人认为假设要设计一个Graphic pipeline,首先要从功能上进行划分,划分成各个unit,就像attila一样,有streamer unit , clipper , Memory controller, PrimitiveAssebly, Rasterizer , Shader.....) ,Unit的内聚性要好(高内聚必定导致独立性不强),Unit之间的耦合降到最低.Attila 用signal的抽象机制实现了unit之间的低耦合(相当于Unit与Unit之间引入了一层抽象),Unit的行为变得更加模式化,状态推断-->接收read
signal--->做对应处理--->Write Signal 这样既统一了unit之间的接口,也减少了unit之间的相关性,缺点是每一个cycle都有一堆一堆的signal,也就是老大说的一堆指针送来送去。
从程序的结构来分析,Simproject那部分仅仅是个壳,真正的详细实现分离到emul那个project中,软件设计上达到了功能和实现的分离。所以说attila的构架设计,从软件上看,我认为还是有非常多可取之处的。接触时间短,理解不深,还请老大和各位高手批评指正错误之处,谢谢。
另外,也想知道要做到硬件实现上的高效性,详细怎样做,构架怎么设计?再次谢谢!:) |
-
1
查看所有评分
-
|
|
|
|
|
|
|
|
|
|
 
-
注冊时间
-
2009-11-15
-
积分
-
156
|
个人看法,仅供參考啊。如有不正确请批评指正。
软件project中,当我们设计软件之初,要进行框架设计,为了我们的设计灵活,更具有弹性,我们常常思考的是将变化的部分和不会变化的部分分开。这样能够让软件开发更规范,更易于扩展,更easy维护,设计模式的非常多思想都源于此。
那么,对于一个graphic pipeline的设计,从软件的角度来说,什么是不变的,什么是常常变化的?
针对attila来说,pipeline的功能,数据的传输和逻辑的控制是不变的,详细来说,就是unit 的功能(比方PrimitiveAssembly是图元装配,但详细怎么装配呢?),unit与unit之间signal的连接建立,数据经由signal的传输,unit状态的控制,read signal and wirte signal .....这些是框架上的东西,是不变的。 变化的是功能的实现,也就是算法,attila的rasterizer就是由两种不同的算法来实现相同的功能。因此,要将功能和不同的算法实现相分离,而不是纠结在一起。这也是Simproject(功能)和emul(不同算法)project的由来。
attila的这样的思想,源自于一种叫strategy的策略模式,策略模式定义了一组算法簇,分别封装起来,让它们之间能够互相替换,此模式让算法的变化独立于算法使用的客户,也就是功能和实现的分离。 |
-
1
查看所有评分
-
|
|
|
|
|
|
|
|
|
|
 
-
注冊时间
-
2009-9-18
-
积分
-
67
|
|
想问各位大牛:Attila的架构和如今的主流GPU的架构一致吗? |
|
|
|
|
|
|
|
|
|
|
 
-
注冊时间
-
2011-11-16
-
积分
-
120
|
ic.expert 发表于 2010-10-30 17:25 
Attila仅仅是一个模拟器,既然是模拟器呢,那主要是给架构师做分析用的,模拟器的架构和硬件架构区别还是 ...
论文和code哪里找的到?
|
|
|
|
|
|
|
|
|
|
|
  
-
注冊时间
-
2009-5-15
-
积分
-
429
|
ic.expert 发表于 2010-10-30 17:25 
Attila仅仅是一个模拟器,既然是模拟器呢,那主要是给架构师做分析用的,模拟器的架构和硬件架构区别还是 ...
ic大能不能举个样例,说说架构师做的分析是怎样利用模拟器的,模拟器和硬件的区别主要是在哪些方面,是什么原因造成了这些区别 |
|
|
|
|
|
|
|
|
|
|
   
-
注冊时间
-
2011-2-19
-
积分
-
1020
|
cxp2760 发表于 2010-10-28 16:31 
想问各位大牛:Attila的架构和如今的主流GPU的架构一致吗?
应该比較过时了吧。似乎仅仅是 DX9 level的东西 |
|
|
|
|
|
|
|
|
|
|
 
-
注冊时间
-
2011-12-29
-
积分
-
196
|
学习,学习  |
|
|
|
|
|
|
|
|
|
|
 
-
注冊时间
-
2012-7-20
-
积分
-
73
|
|
|
|
|
|
|
|
|
|
- GPU keylogger && GPU Based rootkit(Jellyfish rootkit)
catalog . OpenCL . Linux DMA(Direct Memory Access) . GPU rootkit PoC by Team Jellyfish . GPU keylogg ...
- 『TensorFlow』分布式训练_其二_单机多GPU并行&GPU模式设定
建议比对『MXNet』第七弹_多GPU并行程序设计 一.tensorflow GPU设置 GPU指定占用 gpu_options = tf.GPUOptions(per_process_gpu_mem ...
- GPUtil是一个Python模块,使用nvidia-smi从NVIDA GPU获取GPU状态
GPUtil是一个Python模块,使用nvidia-smi从NVIDA GPU获取GPU状态 一个Python模块,用于在Python中使用nvidia-smi以编程方式从NVIDA GPU获取GP ...
- Android studio GPU Monitor :GPU Profiling needs to be enabled in the device's developer options
Android studio GPU Monitor 在真机上不能使用,提示:GPU Profiling needs to be enabled in the device's developer o ...
- tensorflow中使用指定的GPU及GPU显存 CUDA_VISIBLE_DEVICES
参考: https://blog.csdn.net/jyli2_11/article/details/73331126 https://blog.csdn.net/cfarmerreally/arti ...
- (原)tensorflow中使用指定的GPU及GPU显存
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/6591923.html 参考网址: http://stackoverflow.com/questions ...
- Unity Profiler GPU Usage(GPU使用情况)
一般情况下性能瓶颈都在CPU上,这儿也列举下几个常见的GPU耗时函数吧. 1 Render.Mesh 绘制网格面(没批处理的面) 2 Batch.DrawStatic 静态批处理 3 Batch.Dr ...
- tensorflow中使用指定的GPU及GPU显存
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 本文目录 1 终端执行程序时设置使用的GPU 2 python代码中设置使用的GPU 3 设置tensorflow使用的显 ...
- CUDA直方图实例=CPU+GPU(global)+GPU(shared)
项目打包下载链接 顺便批判下CSDN上传坑爹现象,好多次都是到了95%或者99%就不动了.我……
随机推荐
- UVA 11992 - Fast Matrix Operations(段树)
UVA 11992 - Fast Matrix Operations 题目链接 题意:给定一个矩阵,3种操作,在一个矩阵中加入值a,设置值a.查询和 思路:因为最多20列,所以全然能够当作20个线段树 ...
- WP8.1开发者预览版本号已知 Bug
偶的 Lumia 920 已经升级到最新的 8.1 开发者预览版本号,使用中没有发现什么问题. 可能是由于偶玩手机的情况比較少吧!忽然看到 MS 停止此版本号的更新,并说明有非常多的 BUG,偶就郁闷 ...
- 使用jquery点击一个实现button或连接,进行以下div显示,在点击隐藏
jquery代码: <script type="text/javascript" src="js/jquery-1.7.2.js"></scr ...
- 怎么将Emeditor设置成网页查看源代码的默认编译器
1.打开emditor: 2.在菜单栏中找到工具---->自定义,打开自定义窗口: 3.快捷方式--->更多快捷方式 5.选中“在internet explorer中通过emeditor查 ...
- 系列三VisualSvn Server
原文:系列三VisualSvn Server VisualSvn Server介绍 1 .VisualSvn Server VisualSvn Server是免费的,而VisualSvn是收费的.V ...
- HDU2647(拓扑排序+反向建图)
题意不说了,说下思路. 给出的关系是a要求的工资要比b的工资多,因为尽可能的让老板少付钱,那么a的工资就是b的工资+1.能够确定关系为a>b,依据拓扑排序建边的原则是把"小于" ...
- [WebGL入门]四,渲染准备
注意:文章翻译http://wgld.org/,原作者杉本雅広(doxas),文章中假设有我的额外说明,我会加上[lufy:].另外.鄙人webgl研究还不够深入,一些专业词语,假设翻译有误,欢迎大家 ...
- Android MotionEvent事故响应机制
于android于.主要活动包括点击.按.拖累.滑动等操作,这些构成了Android事件响应,总体而言,,所有事件由例如以下三部分构成的基础: 按(action_down),搬家(action_mov ...
- HDU 1195 Open the Lock (双宽搜索)
意甲冠军:给你一个初始4数字和目标4数字,当被问及最初的目标转换为数字后,. 变换规则:每一个数字能够加1(9+1=1)或减1(1-1=9),或交换相邻的数字(最左和最右不是相邻的). 双向广搜:分别 ...
- Ubuntu14.04 工作区设置
记ubuntu您可以切换工作区,但我按住 Ctrl+Alt+方向键 交换器,有没有反应,在这样的使用切换啊. 原来Ubuntu14.04默认并没有开启,仅仅须要设置一下就OK了. 1.打开系统设置.外 ...