gpu和cpu区别

GPU的功耗远远超过CPU
Cache, local memory： CPU > GPU
Threads(线程数): GPU > CPU
Registers: GPU > CPU 多寄存器可以支持非常多的Thread,thread需要用到register,thread数目大，register也必须得跟着很大才行。
SIMD Unit(单指令多数据流,以同步方式，在同一时间内执行同一条指令): GPU > CPU。

在计算机上运行的程序从性能的角度来说大致可分为三类：
(1) I/O intensive;
(2) Memory intensive
(3) Compute-intensive。
　　(1)I/O intensive的程序其性能瓶颈是I/O，也就是说程序运行的大部分时间花在了硬盘读写/网络通信上，而I/O处在计算机体系结构金字塔的最底层，速度非常慢。最近炒的很火的big data 讨论的就是这一类应用程序。几百TB 甚至到PB级别的数据往哪搁，只能放在硬盘上。一台机器容量太小CPU太少怎么办，搞几百台甚至上千台机器用网线连起来分布处理。所以这块全是I/O，现在大的互联网公司不多搞几个上千节点的集群肯定撑不住。
　　(2)Memory intensive的程序其性能瓶颈在内存访问，程序中有大量的随机访问内存的操作，但是基本没有I/O, 这类程序已经比第一类程序快一个数量级了，但是和寄存器的速度还是没法比。目前大部分应用程序都属于这类。个人电脑里装的的各种软件基本就是这类，如果有点I/O, 立刻就会非常得卡。
以上提到的这两类程序的应用最广泛，涵盖了大部分有用的计算机软件，但遗憾的是GPU在这两块毫无用处， GPU只有在计算密集型的程序有些作用。I/O是瓶颈的程序，花在计算的时间可以忽略不计，再怎么用GPU加速也没用。含有大量内存随机访问的程序也不适合在GPU上执行，大量的随机访问甚至可以使GPU的行为由并行变为串行。
什么类型的程序适合在GPU上运行？
　　（1）计算密集型的程序。所谓计算密集型(Compute-intensive)的程序，就是其大部分运行时间花在了寄存器运算上，寄存器的速度和处理器的速度相当，从寄存器读写数据几乎没有延时。可以做一下对比，读内存的延迟大概是几百个时钟周期；读硬盘的速度就不说了，即便是SSD, 也实在是太慢了。
　　（2）易于并行的程序。GPU其实是一种SIMD(Single Instruction Multiple Data)架构，他有成百上千个核，每一个核在同一时间最好能做同样的事情。
　　满足以上两点，就可以用GPU做运算了。不过你还得先用CUDA或者Open CL 把能在GPU上运行的程序写出来，这也是很麻烦的，写一下就知道了。而且GPU的架构比较特殊，要想写出高效率的程序，要花很多很多时间。笔者想说写GPU程序是一件很蛋疼的事情。
　　GPU在某些地方很有用，但应用面比较窄，远远没有某公司声称的那么有用。当今还是Intel的天下，现在计算机的速度已经很快了，计算其实已经不是什么大问题。I/O才是最需要解决的问题。记得曾经看过N家的GTC峰会，黄某人吹得神乎其神，连笔者都被感动了，多少多少T FLOPS的计算速度。程序运行时间从100 秒变成 1秒其实没多重要，你倒杯水的功夫就100秒了。运行时间从100天缩短到1天才是大贡献。前者就是GPU做的事情，后者才是我们真正需要的。

gpu:数量大，计算简单，重复多次
cpu :数量不那么大，计算复杂，重复性低

gpu和cpu区别的更多相关文章

GPU与CPU的区别
作者:虫子君链接:https://www.zhihu.com/question/19903344/answer/96081382 来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载 ...
聊聊GPU与CPU的区别
目录前言 CPU是什么? GPU是什么? GPU与CPU的区别 GPU的由来并行计算 GPU架构优化 GPU和CPU的应用场景作者:小牛呼噜噜 | https://xiaoniuhululu.c ...
GPU、CPU的异同
一.概念 CPU(Center Processing Unit)即中央处理器,GPU(Graphics Processing Unit)即图形处理器. 二.CPU和GPU的相同之处两者都有总线和外界 ...
GPU与CPU
GPU与CPU CPU CPU,也就是中央处理器,结构主要包括控制器(指挥各部分工作).运算器(实现数据加工).寄存器.高缓以及数据/控制/状态总线.计算机的性能很大程度上依赖于CPU,CPU的功能包 ...
使用PCAST检测散度以比较GPU和CPU结果
使用PCAST检测散度以比较GPU和CPU结果并行编译器辅助软件测试(PCAST)是英伟达HPC FORTRAN.C++和C编译器中的一个特性.PCAST有两个用例.一个新的处理器或新的编译程序的部 ...
【转】GPU 与CPU的作用协调，工作流程、GPU整合到CPU得好处
在不少人的心目中,显卡最大的用途可能就只有两点--玩游戏.看电影,除此之外,GPU并没有其他的作用了.但是随着微软IE9的正式发布,不少人突然发现,微软一直提到一个名词:GPU硬件加速,从而也让不少人 ...
GPU 与CPU的作用协调，工作流程、GPU整合到CPU得好处
http://blog.csdn.net/maopig/article/details/6803141 在不少人的心目中,显卡最大的用途可能就只有两点——玩游戏.看电影,除此之外,GPU并没有其他的作 ...
YOLO---Darknet下的 GPU vs CPU 速度
YOLO---Darknet下的 GPU vs CPU 速度目录一.基础环境二.安装Darknet-yolo v3 三.CPU下测试四.GPU下测试五.测试速度对比结论正文一.基础环境 ...
[深度学习] Pytorch（三）—— 多/单GPU、CPU，训练保存、加载模型参数问题
[深度学习] Pytorch(三)-- 多/单GPU.CPU,训练保存.加载预测模型问题上一篇实践学习中,遇到了在多/单个GPU.GPU与CPU的不同环境下训练保存.加载使用使用模型的问题,如果保存 ...

随机推荐

day4正则表达式
语法: 正则表达式是处理字符串的函数,我们在Excel函数中也有很多这样的公式,因为学过一些Excel,所以看一下有什么不同的方法. import re #导入re模块,处理正则表达式的模 ...
【LOJ】#6289. 花朵
题解我当时连$n^2$的树背包都搞不明白,这道题稳稳的爆零啊= = 然后听说这道题需要FFT--我当时FFT的板子都敲不对,然后这道题就扔了然后,我去考了thusc--好吧,令人不愉快的经历, ...
Intel Code Challenge Final Round (Div. 1 + Div. 2, Combined) G - Xor-matic Number of the Graph 线性基好题
G - Xor-matic Number of the Graph 上一道题的加强版本,对于每个联通块需要按位算贡献. #include<bits/stdc++.h> #define LL ...
TestDirector其他
一.查看连接TD的用户 1.用单击界面上的“Connections”按钮,进入如下图: 二.Licenses管理 1.单击“Licenses”按钮,显示如下图: 2.单击“Modify License ...
添加到sudo组里
$visudo //切记,此处没有vi和sudo之间没有空格 1.移动光标,到最后一行(最好是找到root ALL=(ALL) ALL,在下面添加一行) 2.按a,进入append模式3.输入 ...
第12课：Spark Streaming源码解读之Executor容错安全性
一.Spark Streaming 数据安全性的考虑: Spark Streaming不断的接收数据,并且不断的产生Job,不断的提交Job给集群运行.所以这就涉及到一个非常重要的问题数据安全性. S ...
ref:一种新的攻击方法——Java Web表达式注入
ref:https://blog.csdn.net/kk_gods/article/details/51840683 一种新的攻击方法——Java Web表达式注入 2016年07月06日 17:01 ...
mcnp的重复探测器单元计数-fmesh卡的介绍
第一步:首先前面是cell surface和material等的定义,忽略,然后写上下面的这些抽样信息等.最后写入fmesh卡的信息定义第二步:计算上述输入卡,得到结果,显然不在outx,x代表p ...
使用ApplicationContext
ApplicationContext覆盖了BeanFactory的所有功能,并提供了更多的特,容器创建时就创建了singleton Bean 相对BeanFactory而言,ApplicationCo ...
iOS 9音频应用播放音频之iOS 9音频播放进度
iOS 9音频应用播放音频之iOS 9音频播放进度 iOS 9音频应用开发播放进度音频文件在播放后经过了多久以及还有多久才可以播放完毕,想必是用户所关注的问题.为了解决这一问题,在很多的音乐播放器中 ...

gpu和cpu区别

gpu和cpu区别的更多相关文章

随机推荐

热门专题