Pascal GPU

Pascal (from French mathematician Blaise Pascal) is Maxwell successor. In this news, we learnt that Volta was the post-Maxwell architecture, but it seems that Pascal is the new official name. One of the main feature of the Pascal architecture is the 3D memory or stacked DRAM that should provide terabyte bandwidth.

Update (2014.03.26): according to techreportVolta is the successor of Pascal:

Turns out Volta remains on the roadmap, but it comes after Pascal and will evidently include more extensive changes to Nvidia’s core GPU architecture.

Maxwell GPU architecture (post-Kepler) is not available yet, but NVIDIA is already talking, at GTC 2013, about post-Maxwell architecture called Volta that features 3D stacked DRAM in order to provide terabyte bandwidth.

According to the guys at videocardz, NVIDIA Maxwell GM107 features 128 CUDA cores per SMX (streaming multiprocessor) against 192 for a Kepler-based GPU. The GeForce GTX 750 Ti has 5 SMX (640 cores) while the GTX 750 packs 512 cores in 4 SMX. The L2 cache has also received some changes: in Kepler the L2 cache has 256KB while on Maxwell, the cache has 2MB!

In the power consumption side, the GM107 has a TDP of 60W. And to finish, the GM107 will offer at least the same level (if not better) of performance than the GF100, the GPU behind the old good GTX 480.

Update (2013.03.20)

NVIDIA has just launched the first graphics cards based on Maxwell, NVIDIA’s new GPU architecture. TheGeForce GTX 750 Ti and GeForce GTX 750 are both powered by a GM107, a cut down version of an upcoming flagship (GM110 ?) GPU. The Maxwell architecture is focused on power efficiency:

Kepler SMXs (streaming multiprocessors) are now replaced by Maxwell SMMs. A SMM packs 128 CUDA cores(SMX = 192 cores). The L2 cache size has been increased from 256KB in Kepler to 2048KB in Maxwell.

The new GTX 750 and GTX 750 Ti targets the old GeForce GTX 650 Ti and the recently launched AMD Radeon R7 265.

GeForce GTX 750 Ti specifications

  • GPU: GM107 @ 1020MHz (base) / 1085MHz (boost), 28nm
  • Cores: 640 (5 SMMs)
  • Texture units: 40
  • ROPs: 16
  • Memory: 2048MB @ 5.4GHz GDDR5, 128-bit
  • TDP: 60W
  • Price: USD $149

GeForce GTX 750 specifications

  • GPU: GM107 @ 1020MHz (base) / 1085MHz (boost), 28nm
  • Cores: 512 (4 SMMs)
  • Texture units: 32
  • ROPs: 16
  • Memory: 1024MB @ 5.0GHz GDDR5, 128-bit
  • TDP: 55W
  • Price: USD $119

Related Articles and Reviews


NVIDIA GeForce GTX 750 Ti global performance

 

Tesla-> Fermi (550Ti) -> Kepler(680) -> Maxwell (750Ti) -> Volta(was Pascal)的更多相关文章

  1. CUDA ---- GPU架构(Fermi、Kepler)

    GPU架构 SM(Streaming Multiprocessors)是GPU架构中非常重要的部分,GPU硬件的并行性就是由SM决定的. 以Fermi架构为例,其包含以下主要组成部分: CUDA co ...

  2. NVIDIA GPU架构与原理分析(一)——GPU简介与主流Fermi、Kepler架构GPU概述

    1 GPU简介 图形处理单元GPU英文全称Graphic Processing Unit,GPU是相对于CPU的一个概念,NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GP ...

  3. AI芯片

    课程作业,正好自己也在学深度学习,正好有所帮助,做了深度学习的AI芯片调研,时间比较短,写的比较仓促,大家随便看看 近年来,深度学习技术,如卷积神经网络(CNN).递归神经网络(RNN)等,成为计算机 ...

  4. CUDA程序设计(一)

    为什么需要GPU 几年前我启动并主导了一个项目,当时还在谷歌,这个项目叫谷歌大脑.该项目利用谷歌的计算基础设施来构建神经网络. 规模大概比之前的神经网络扩大了一百倍,我们的方法是用约一千台电脑.这确实 ...

  5. CSDN日报20170312——《成功人士的七个习惯》

    [程序人生]成功人士的七个习惯 作者:liumiaocn 所谓温故而知新.重读往往会带来新的收获,即使没有新的收获,可以带来新的思考也是非常不错.在个人成长的历程中.习惯所扮演的角色不言而喻,Step ...

  6. 显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么?

    在使用深度学习框架的过程中一定会经常碰到这些东西,虽然anaconda有时会帮助我们自动地解决这些设置,但是有些特殊的库却还是需要我们手动配置环境,但是我对标题上的这些名词其实并不十分清楚,所以老是被 ...

  7. CUDA Programming Guide 学习笔记

    CUDA学习笔记 GPU架构 GPU围绕流式多处理器(SM)的可扩展阵列搭建,每个GPU有多个SM,每个SM支持数百个线程并发执行.目前Nvidia推出了6种GPU架构(按时间顺序,详见下图):Fer ...

  8. NVIDIA FFmpeg 转码技术分析

    NVIDIA FFmpeg 转码技术分析 所有从 Kepler 一代开始的 NVIDIA GPUs 都支持完全加速的硬件视频编码,而从费米一代开始的所有 GPUs 都支持完全加速的硬件视频解码.截至 ...

  9. Life of a triangle - NVIDIA's logical pipeline

    Home GameWorks Blog Life of a triangle - NVIDIA's logical pipeline   Life of a triangle - NVIDIA's l ...

随机推荐

  1. Catch That Cow(poj 3278)

    给定两个整数n和k 通过 n+1或n-1 或n*2 这3种操作,使得n==k 输出最少的操作次数 //广搜,a是队列,step记录步数,vis记录哪些数被搜到过 #include<cstdio& ...

  2. 大端(big endian)和小端(little endian)

    http://www.cnblogs.com/Romi/archive/2012/01/10/2318551.html 当前的存储器,多以byte为访问的最小单元,当一个逻辑上的地址必须分割为物理上的 ...

  3. CentOS下源码安装mplayer播放器

    http://www.mplayerhq.hu/MPlayer/releases/ [root@ok MPlayer-1.2.1]# pwd /root/MPlayer-1.2.1 http://ww ...

  4. ssdb使用

    安装 wget --no-check-certificate https://github.com/ideawu/ssdb/archive/master.zip unzip master cd ssd ...

  5. hdu 3746 kmp求循环节

    题意就是将所给的字符串变成多个完整的循环(至少两个),然后给出最少需要添加的字符数.

  6. TypeC一个微软开发的超简单.NET依赖注入/IoC容器

    控制反转(IoC,Inversion of Control)是由Martin Fowler总结出来的一种设计模式,用来减少代码间的耦合.一般而言,控制反转分为依赖注入(Dependency Injec ...

  7. 【JNI】C分支

    public class MainActivity extends Activity { static{ System.loadLibrary("hello"); } @Overr ...

  8. 利用crontab定时备份数据库为sql文件

    测试: 每1分钟执行1次,利用crontab */1 * * * * /opt/nginx/db_bak.sh 每天的0点0分把数据库备份为日期格式 0 0 * * * /opt/nginx/db_b ...

  9. js:数据结构笔记14--高级算法

    动态规划: 递归是从顶部开始将问题分解,通过解决所有分解出小问题来解决整体问题: 动态规划从底部开始解决问题,将所有小问题解决,然后合并掉一个整体解决方案: function dynFib(n) { ...

  10. 简单几何(线段相交)+模拟 POJ 3449 Geometric Shapes

    题目传送门 题意:给了若干个图形,问每个图形与哪些图形相交 分析:题目说白了就是处理出每个图形的线段,然后判断是否相交.但是读入输出巨恶心,就是个模拟题加上线段相交的判断,我第一次WA不知道输出要按字 ...