NV Maxwell architecture
按照NVIDIA的路线图来看,GTX 600以及GTX 700系列所采用的Kepler架构已经垂垂老矣,最早在明年第一季度,其继任者Maxwell架构可能就会和我们正式见面了。目前外媒已经放出了关于Maxwell的架构规格,但还无法确定是否为真。
根据WCCFTech的报道,Maxwell架构依然采用来自台积电的28nm制造工艺,而NVIDIA计划推出四款Maxwell芯片,分别是GM104、GM106、GM108和GM100,相对目前的Kepler来说,Maxwell最为明显的特性就是CUDA核心会有爆发性的提升,而深层次的改变则是增强SMX单元设计并优化双精度逻辑单元。
具体来说,Maxwell的每个SMX单元将会拥有256个CUDA核心,而目前Kepler架构中这一数字为192个,当然由于DP单元和纹理单元数量保持不变,所以DP双精度浮点单元的比例会从Kepler的1:3降低到1:4。当然Maxwell依然会延续Kepler中DP双精度浮点单元可关闭的特性,从而降低功耗。
除了数量上的变化之外,Maxwell魅族SMX单元会的寄存器数量会增加两个,L1缓存会从64kb增加到128kb,而且可以32/96、64/64、96/32的比列来分配成缓存和共享内存。另外每个GPC单元中还会有768kb的L2缓存作为指令集缓存。
GPU架构路线图
下面来看看具体的核心:
GM108:
GM108拥有576个CUDA核心,48个纹理单元,8个光栅单元,显存位宽为64bit,核心面积则和当年的GF117差不多,显然是低端入门级产品。
据说在GM108之前还有一个GM107,但尚不能确定具体规格。
GM106:
GM106自然是要取代目前的GK106了,定位中端,具体取代的产品是GTX 650Ti以及GTX 660家族。
GM106的CUDA核心数量从GK106的960个暴涨到2304个,拥有144个纹理单元,24个光栅单元,显存位宽为192bit,容量为3GB,等效显存频率能够达到7GHz左右。
GM104:
从命名上看他显然是为了接替目前的GK104核心,也就说定位中高端。
CM104拥有5组GPC单元(GK104为4组),共计3840个CUDA核心、240个纹理单元以及40个光栅单元,位宽为320bit,容量为3GB,也有可能是2.5GB。核心频率可能会在1GHz左右,等效显存频率能够达到7GHz左右。
GM100:
GM100是完整的Maxwell架构,共计有8个GPC单元,每个GPC单元有三组SMX单元,总计之后拥有6144个CUDA核心,384个纹理单元以及64个光栅单元,显存位宽512bit,容量更是达到了夸张的8GB。
具体频率方面,GeForce系列的GM100核心频率为930MHz左右,加速频率为1GHz左右,而Tesla中的GM100核心频率为850MHz左右,双精度浮点性能为2.61TFLOPS,达到目前GTX TITAN的两倍。
如果Maxwell架构真的和文中说的这么强大的话,那么下一代的NVIDIA显卡的性能确实值得我们期待,AMD会拿什么来抵挡呢?
NV Maxwell architecture的更多相关文章
- Tesla-> Fermi (550Ti) -> Kepler(680) -> Maxwell (750Ti) -> Volta(was Pascal)
Pascal GPU Pascal (from French mathematician Blaise Pascal) is Maxwell successor. In this news, we l ...
- NVlink
Nvidia's Pascal to use stacked memory, proprietary NVLink interconnect by Scott Wasson — 6:50 PM on ...
- [CUDA] 00 - GPU Driver Installation & Concurrency Programming
前言 对,这是一个高大上的技术,终于要做老崔当年做过的事情了,生活很传奇. 一.主流 GPU 编程接口 1. CUDA 是英伟达公司推出的,专门针对 N 卡进行 GPU 编程的接口.文档资料很齐全,几 ...
- Introduction to 3D Game Programming with DirectX 12 学习笔记之 --- 第十八章:立方体贴图
原文:Introduction to 3D Game Programming with DirectX 12 学习笔记之 --- 第十八章:立方体贴图 代码工程地址: https://github.c ...
- NVIDIA GPU Pascal架构简述
NVIDIA GPU Pascal架构简述 本文摘抄自英伟达Pascal架构官方白皮书:https://www.nvidia.com/en-us/data-center/resources/pasca ...
- 5 Things You Should Know About the New Maxwell GPU Architecture
The introduction this week of NVIDIA’s first-generation “Maxwell” GPUs is a very exciting moment for ...
- [ZZ] Maxwell 架构
http://digi.163.com/14/0218/23/9LDCTFON00162DSP.html [IT168 评测]随着一句“娘娘,封神啦(宝鸡口音)”,中国的观众迅速认识到了两个极其出彩的 ...
- Nvidia 的新显卡架构 Maxwell 性能相比开普勒提升了多少?
作者:喵西和熊链接:https://www.zhihu.com/question/22630075/answer/29041618来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注 ...
- nvcc fatal : Unsupported gpu architecture 'compute_11'
使用VS编译OpenCV编译源代码时候,对Cmake生成的工程文件编译,会出现 nvcc fatal : Unsupported gpu architecture 'compute_11' 问题.原 ...
随机推荐
- 一个绚丽的loading动效分析与实现!
最终效果如下 从效果上看,我们需要考虑以下几个问题: 1.叶子的随机产生: 2.叶子随着一条正余弦曲线移动: 3.叶子在移动的时候旋转,旋转方向随机,正时针或逆时针: 4.叶子遇到进度条,似乎是融合进 ...
- hadoop中常见的问题
一.在root下进行格式化 这样很糟糕 这样的话,若是第一次装的话,我的建议是将生成的文件都删掉,恢复到最开始的状态, 1. 首先你需要删除 vi conf/hdfs-site.xml 配置文件的 ...
- 用于主题检测的临时日志(ba86b8a0-7ed7-4b0b-bf1f-ce41aa2a5780 - 3bfe001a-32de-4114-a6b4-4005b770f6d7)
这是一个未删除的临时日志.请手动删除它.(ea9f667f-3be0-45c8-ad82-3acf819d571c - 3bfe001a-32de-4114-a6b4-4005b770f6d7)
- matlab练习程序(多圆交点)
最近总是对计算几何方面的程序比较感兴趣. 多圆求交点,要先对圆两两求交点. 有交点的圆分为相切圆和相交圆. 相切圆求法: 1.根据两圆心求直线 2.求公共弦直线方程 3.求两直线交点即两圆切点. 相交 ...
- 【Tyvj】1473校门外的树3 线段树/树状数组 <区间修改+单点访问>
描述 校门外有很多树,有苹果树,香蕉树,有会扔石头的,有可以吃掉补充体力的……如今学校决定在某个时刻在某一段种上一种树,保证任一时刻不会出现两段相同种类的树,现有两个操作:K=1,读入l,r表示在l ...
- Android中动画
两种动画 view动画 属性动画 (也可以使用xml描述动画) view 4动画 补间动画 渐变 AlphaAnimation 缩放 ScaleAnimation 平移 TranslateAnima ...
- 关于P,V操作理解的分析
P-V操作定义: 假设sem是个整型变量. P原语的主要操作是: (1)sem减1: (2)若sem减1后仍大于或等于零,则该进程继续执行: (3)若sem减1后小于零,则该进程被阻塞,在相应队列 ...
- Hark的数据结构与算法练习之插入排序
算法说明: 先是拿语言进行一下描述: 假如是做降序排序,那么从头开始扫描每个数字,使每个数字与它前面的若干数字进行比较,直接找到小于当前数字a(当前数字以a代替)的数字b(小于a的数字以b代替). 然 ...
- VMware Tools安装
不是每一个程序员都必须玩过linux,只是博主觉得现在的很多服务器都是linux系统的,而自己属于那种前端也搞,后台也搞,对框架搭建也感兴趣,但是很多生产上的框架和工具都是安装在服务器上的,而且有不少 ...
- LCIS HDOJ 4512 吉哥系列故事——完美队形I
题目传送门 题意:中文题面 分析:LCIS应用:设置b[]为a[]的反转,然后LCIS,若相等的是自己本身,则+1, 否则+2 代码: #include <cstdio> #include ...