Pascal GPU

Pascal (from French mathematician Blaise Pascal) is Maxwell successor. In this news, we learnt that Volta was the post-Maxwell architecture, but it seems that Pascal is the new official name. One of the main feature of the Pascal architecture is the 3D memory or stacked DRAM that should provide terabyte bandwidth.

Update (2014.03.26): according to techreportVolta is the successor of Pascal:

Turns out Volta remains on the roadmap, but it comes after Pascal and will evidently include more extensive changes to Nvidia’s core GPU architecture.

Maxwell GPU architecture (post-Kepler) is not available yet, but NVIDIA is already talking, at GTC 2013, about post-Maxwell architecture called Volta that features 3D stacked DRAM in order to provide terabyte bandwidth.

According to the guys at videocardz, NVIDIA Maxwell GM107 features 128 CUDA cores per SMX (streaming multiprocessor) against 192 for a Kepler-based GPU. The GeForce GTX 750 Ti has 5 SMX (640 cores) while the GTX 750 packs 512 cores in 4 SMX. The L2 cache has also received some changes: in Kepler the L2 cache has 256KB while on Maxwell, the cache has 2MB!

In the power consumption side, the GM107 has a TDP of 60W. And to finish, the GM107 will offer at least the same level (if not better) of performance than the GF100, the GPU behind the old good GTX 480.

Update (2013.03.20)

NVIDIA has just launched the first graphics cards based on Maxwell, NVIDIA’s new GPU architecture. TheGeForce GTX 750 Ti and GeForce GTX 750 are both powered by a GM107, a cut down version of an upcoming flagship (GM110 ?) GPU. The Maxwell architecture is focused on power efficiency:

Kepler SMXs (streaming multiprocessors) are now replaced by Maxwell SMMs. A SMM packs 128 CUDA cores(SMX = 192 cores). The L2 cache size has been increased from 256KB in Kepler to 2048KB in Maxwell.

The new GTX 750 and GTX 750 Ti targets the old GeForce GTX 650 Ti and the recently launched AMD Radeon R7 265.

GeForce GTX 750 Ti specifications

  • GPU: GM107 @ 1020MHz (base) / 1085MHz (boost), 28nm
  • Cores: 640 (5 SMMs)
  • Texture units: 40
  • ROPs: 16
  • Memory: 2048MB @ 5.4GHz GDDR5, 128-bit
  • TDP: 60W
  • Price: USD $149

GeForce GTX 750 specifications

  • GPU: GM107 @ 1020MHz (base) / 1085MHz (boost), 28nm
  • Cores: 512 (4 SMMs)
  • Texture units: 32
  • ROPs: 16
  • Memory: 1024MB @ 5.0GHz GDDR5, 128-bit
  • TDP: 55W
  • Price: USD $119

Related Articles and Reviews


NVIDIA GeForce GTX 750 Ti global performance

 

Tesla-> Fermi (550Ti) -> Kepler(680) -> Maxwell (750Ti) -> Volta(was Pascal)的更多相关文章

  1. CUDA ---- GPU架构(Fermi、Kepler)

    GPU架构 SM(Streaming Multiprocessors)是GPU架构中非常重要的部分,GPU硬件的并行性就是由SM决定的. 以Fermi架构为例,其包含以下主要组成部分: CUDA co ...

  2. NVIDIA GPU架构与原理分析(一)——GPU简介与主流Fermi、Kepler架构GPU概述

    1 GPU简介 图形处理单元GPU英文全称Graphic Processing Unit,GPU是相对于CPU的一个概念,NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GP ...

  3. AI芯片

    课程作业,正好自己也在学深度学习,正好有所帮助,做了深度学习的AI芯片调研,时间比较短,写的比较仓促,大家随便看看 近年来,深度学习技术,如卷积神经网络(CNN).递归神经网络(RNN)等,成为计算机 ...

  4. CUDA程序设计(一)

    为什么需要GPU 几年前我启动并主导了一个项目,当时还在谷歌,这个项目叫谷歌大脑.该项目利用谷歌的计算基础设施来构建神经网络. 规模大概比之前的神经网络扩大了一百倍,我们的方法是用约一千台电脑.这确实 ...

  5. CSDN日报20170312——《成功人士的七个习惯》

    [程序人生]成功人士的七个习惯 作者:liumiaocn 所谓温故而知新.重读往往会带来新的收获,即使没有新的收获,可以带来新的思考也是非常不错.在个人成长的历程中.习惯所扮演的角色不言而喻,Step ...

  6. 显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么?

    在使用深度学习框架的过程中一定会经常碰到这些东西,虽然anaconda有时会帮助我们自动地解决这些设置,但是有些特殊的库却还是需要我们手动配置环境,但是我对标题上的这些名词其实并不十分清楚,所以老是被 ...

  7. CUDA Programming Guide 学习笔记

    CUDA学习笔记 GPU架构 GPU围绕流式多处理器(SM)的可扩展阵列搭建,每个GPU有多个SM,每个SM支持数百个线程并发执行.目前Nvidia推出了6种GPU架构(按时间顺序,详见下图):Fer ...

  8. NVIDIA FFmpeg 转码技术分析

    NVIDIA FFmpeg 转码技术分析 所有从 Kepler 一代开始的 NVIDIA GPUs 都支持完全加速的硬件视频编码,而从费米一代开始的所有 GPUs 都支持完全加速的硬件视频解码.截至 ...

  9. Life of a triangle - NVIDIA's logical pipeline

    Home GameWorks Blog Life of a triangle - NVIDIA's logical pipeline   Life of a triangle - NVIDIA's l ...

随机推荐

  1. 矩形覆盖(codevs 1101)

    题目描述 Description 在平面上有 n 个点(n <= 50),每个点用一对整数坐标表示.例如:当 n=4 时,4个点的坐标分另为:p1(1,1),p2(2,2),p3(3,6),P4 ...

  2. .net学习笔记----会话状态Session

    一.会话状态Session Session用于服务器端状态管理,使用Session之后,每个客户端都可以将实际的数据保存在服务器上,对于每个客户端的数据,将会生成一个对应的唯一的key(保存在客户端) ...

  3. 态势感知 > 技术运维问题

    http://blog.csdn.net/sanmaoljh/article/details/52670226 http://u.sanwen.net/subject/250516.html http ...

  4. Android中make命令

    转自:http://blog.sina.com.cn/s/blog_abc7e49a01011y0n.html 1.make -jXX  XX表示数字,这个命令将编译Android系统并生成镜像,XX ...

  5. 让/etc/profile文件修改后立即生效(转)

    方法1:让/etc/profile文件修改后立即生效 ,可以使用如下命令:# .  /etc/profile注意: . 和 /etc/profile 有空格方法2:让/etc/profile文件修改后 ...

  6. DOM--1 遵循最佳实践

    为重用命名空间而进行规划 (function() { function $(id) { return document.getElementById(id); } function alertNode ...

  7. WireShark数据包分析数据封装

    WireShark数据包分析数据封装 数据封装(Data Encapsulation)是指将协议数据单元(PDU)封装在一组协议头和尾中的过程.在OSI七层参考模型中,每层主要负责与其它机器上的对等层 ...

  8. http://jingyan.baidu.com/article/bad08e1ee14ae409c85121cf.html

    http://jingyan.baidu.com/article/bad08e1ee14ae409c85121cf.html

  9. NOI2012 : 迷失游乐园

    终于补完NOI2012了好开心~ 题目大意:给定一棵树或者环套外向树,求出从中随机选一条简单路径的期望长度,环上点数不超过20. 设 d[x]表示x的度数,ch[x]表示x孩子个数 up[x]表示x向 ...

  10. HDU 1180 (BFS搜索)

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=1180 题目大意:迷宫中有一堆楼梯,楼梯横竖变化.这些楼梯在奇数时间会变成相反状态,通过楼梯会顺便到达 ...