Pascal GPU

Pascal (from French mathematician Blaise Pascal) is Maxwell successor. In this news, we learnt that Volta was the post-Maxwell architecture, but it seems that Pascal is the new official name. One of the main feature of the Pascal architecture is the 3D memory or stacked DRAM that should provide terabyte bandwidth.

Update (2014.03.26): according to techreportVolta is the successor of Pascal:

Turns out Volta remains on the roadmap, but it comes after Pascal and will evidently include more extensive changes to Nvidia’s core GPU architecture.

Maxwell GPU architecture (post-Kepler) is not available yet, but NVIDIA is already talking, at GTC 2013, about post-Maxwell architecture called Volta that features 3D stacked DRAM in order to provide terabyte bandwidth.

According to the guys at videocardz, NVIDIA Maxwell GM107 features 128 CUDA cores per SMX (streaming multiprocessor) against 192 for a Kepler-based GPU. The GeForce GTX 750 Ti has 5 SMX (640 cores) while the GTX 750 packs 512 cores in 4 SMX. The L2 cache has also received some changes: in Kepler the L2 cache has 256KB while on Maxwell, the cache has 2MB!

In the power consumption side, the GM107 has a TDP of 60W. And to finish, the GM107 will offer at least the same level (if not better) of performance than the GF100, the GPU behind the old good GTX 480.

Update (2013.03.20)

NVIDIA has just launched the first graphics cards based on Maxwell, NVIDIA’s new GPU architecture. TheGeForce GTX 750 Ti and GeForce GTX 750 are both powered by a GM107, a cut down version of an upcoming flagship (GM110 ?) GPU. The Maxwell architecture is focused on power efficiency:

Kepler SMXs (streaming multiprocessors) are now replaced by Maxwell SMMs. A SMM packs 128 CUDA cores(SMX = 192 cores). The L2 cache size has been increased from 256KB in Kepler to 2048KB in Maxwell.

The new GTX 750 and GTX 750 Ti targets the old GeForce GTX 650 Ti and the recently launched AMD Radeon R7 265.

GeForce GTX 750 Ti specifications

  • GPU: GM107 @ 1020MHz (base) / 1085MHz (boost), 28nm
  • Cores: 640 (5 SMMs)
  • Texture units: 40
  • ROPs: 16
  • Memory: 2048MB @ 5.4GHz GDDR5, 128-bit
  • TDP: 60W
  • Price: USD $149

GeForce GTX 750 specifications

  • GPU: GM107 @ 1020MHz (base) / 1085MHz (boost), 28nm
  • Cores: 512 (4 SMMs)
  • Texture units: 32
  • ROPs: 16
  • Memory: 1024MB @ 5.0GHz GDDR5, 128-bit
  • TDP: 55W
  • Price: USD $119

Related Articles and Reviews


NVIDIA GeForce GTX 750 Ti global performance

 

Tesla-> Fermi (550Ti) -> Kepler(680) -> Maxwell (750Ti) -> Volta(was Pascal)的更多相关文章

  1. CUDA ---- GPU架构(Fermi、Kepler)

    GPU架构 SM(Streaming Multiprocessors)是GPU架构中非常重要的部分,GPU硬件的并行性就是由SM决定的. 以Fermi架构为例,其包含以下主要组成部分: CUDA co ...

  2. NVIDIA GPU架构与原理分析(一)——GPU简介与主流Fermi、Kepler架构GPU概述

    1 GPU简介 图形处理单元GPU英文全称Graphic Processing Unit,GPU是相对于CPU的一个概念,NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GP ...

  3. AI芯片

    课程作业,正好自己也在学深度学习,正好有所帮助,做了深度学习的AI芯片调研,时间比较短,写的比较仓促,大家随便看看 近年来,深度学习技术,如卷积神经网络(CNN).递归神经网络(RNN)等,成为计算机 ...

  4. CUDA程序设计(一)

    为什么需要GPU 几年前我启动并主导了一个项目,当时还在谷歌,这个项目叫谷歌大脑.该项目利用谷歌的计算基础设施来构建神经网络. 规模大概比之前的神经网络扩大了一百倍,我们的方法是用约一千台电脑.这确实 ...

  5. CSDN日报20170312——《成功人士的七个习惯》

    [程序人生]成功人士的七个习惯 作者:liumiaocn 所谓温故而知新.重读往往会带来新的收获,即使没有新的收获,可以带来新的思考也是非常不错.在个人成长的历程中.习惯所扮演的角色不言而喻,Step ...

  6. 显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么?

    在使用深度学习框架的过程中一定会经常碰到这些东西,虽然anaconda有时会帮助我们自动地解决这些设置,但是有些特殊的库却还是需要我们手动配置环境,但是我对标题上的这些名词其实并不十分清楚,所以老是被 ...

  7. CUDA Programming Guide 学习笔记

    CUDA学习笔记 GPU架构 GPU围绕流式多处理器(SM)的可扩展阵列搭建,每个GPU有多个SM,每个SM支持数百个线程并发执行.目前Nvidia推出了6种GPU架构(按时间顺序,详见下图):Fer ...

  8. NVIDIA FFmpeg 转码技术分析

    NVIDIA FFmpeg 转码技术分析 所有从 Kepler 一代开始的 NVIDIA GPUs 都支持完全加速的硬件视频编码,而从费米一代开始的所有 GPUs 都支持完全加速的硬件视频解码.截至 ...

  9. Life of a triangle - NVIDIA's logical pipeline

    Home GameWorks Blog Life of a triangle - NVIDIA's logical pipeline   Life of a triangle - NVIDIA's l ...

随机推荐

  1. Hadoop配置文件

    部分内容参考:http://www.linuxqq.net/archives/964.html  http://slaytanic.blog.51cto.com/2057708/1100974/ ht ...

  2. 编译预处理命令--define和ifdef的使用

    这里将对常用的预处理命令进行学习. 一.宏定义  ·defined 格式:`defined     宏名      数值 或者 `define      宏名 注意:后面没有‘;‘,和单片机不一样: ...

  3. Linux下创建ftp用户并锁定根目录

    [root@d vsftpd]# vi /etc/vsftpd/chroot_list 加入要锁定根目录的ftp用户名(一行只能一个用户) [root@ vsftpd]# vi /etc/vsftpd ...

  4. 《Java程序性能优化》学习笔记 程序优化

    这一部分主要介绍代码层的优化.了解如何编写高效而精炼的代码,正确的使用函数方法.1.字符串优化处理Java语言中,String对象可以认为是对char数组的眼神和进一步封装.它主要由3部分组成:cha ...

  5. SVN服务器搭建和使用(二)(转载)

    转载地址:http://www.cnblogs.com/xiaobaihome/archive/2012/03/20/2407979.html 上一篇介绍了VisualSVN Server和Torto ...

  6. java_ant详解

    转自:http://hi.baidu.com/victorlin23/item/721b892c770be3d7a517b695 1,什么是antant是构建工具2,什么是构建概念到处可查到,形象来说 ...

  7. ntpd时间同步 安装与配置

    1,安装 yum -y install ntp vim /etc/ntp.conf 默认配置: driftfile /var/lib/ntp/drift restrict default kod no ...

  8. Github排行榜

    http://githubranking.com/ 中国区开发者排行榜: http://githubrank.com/ 也可以在官网查询: https://github.com/search?q=st ...

  9. NGUI全面实践教程(大学霸内部资料)

    NGUI全面实践教程(大学霸内部资料)   试读文档下载地址:链接:http://pan.baidu.com/s/1jGosC9g 密码:8jq5 介绍:NGUI全面实践教程(大学霸内部资料)本书是国 ...

  10. Buy the Ticket

    Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission( ...